Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros

ilustraciones, diagramas, tablas

Autores:
Marín Benjumea, Yubar Daniel
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/81466
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/81466
https://repositorio.unal.edu.co/
Palabra clave:
000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
Datos
Comprensión de datos
Calidad de datos
Gestión de datos maestros
Dimensiones de calidad de datos
Limpieza de datos
Data quality
Master data management
Data quality dimensions
Data cleaning
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
id UNACIONAL2_717fc0976bcc675faee878ddb8c25f82
oai_identifier_str oai:repositorio.unal.edu.co:unal/81466
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
dc.title.translated.eng.fl_str_mv Methodology for data quality management using a data driven approach to implement data quality assessment and improvement processes in master data management initiatives
title Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
spellingShingle Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
Datos
Comprensión de datos
Calidad de datos
Gestión de datos maestros
Dimensiones de calidad de datos
Limpieza de datos
Data quality
Master data management
Data quality dimensions
Data cleaning
title_short Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
title_full Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
title_fullStr Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
title_full_unstemmed Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
title_sort Metodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestros
dc.creator.fl_str_mv Marín Benjumea, Yubar Daniel
dc.contributor.advisor.none.fl_str_mv Branch Bedoya, John Willian
Iral Palomino, René
dc.contributor.author.none.fl_str_mv Marín Benjumea, Yubar Daniel
dc.subject.ddc.spa.fl_str_mv 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
topic 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
Datos
Comprensión de datos
Calidad de datos
Gestión de datos maestros
Dimensiones de calidad de datos
Limpieza de datos
Data quality
Master data management
Data quality dimensions
Data cleaning
dc.subject.lemb.none.fl_str_mv Datos
Comprensión de datos
dc.subject.proposal.spa.fl_str_mv Calidad de datos
Gestión de datos maestros
Dimensiones de calidad de datos
Limpieza de datos
dc.subject.proposal.eng.fl_str_mv Data quality
Master data management
Data quality dimensions
Data cleaning
description ilustraciones, diagramas, tablas
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-05-31T20:26:19Z
dc.date.available.none.fl_str_mv 2022-05-31T20:26:19Z
dc.date.issued.none.fl_str_mv 2022
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/81466
dc.identifier.instname.spa.fl_str_mv Universidad Nacional de Colombia
dc.identifier.reponame.spa.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
dc.identifier.repourl.spa.fl_str_mv https://repositorio.unal.edu.co/
url https://repositorio.unal.edu.co/handle/unal/81466
https://repositorio.unal.edu.co/
identifier_str_mv Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Amicis, F. D. (2004). A methodology for data quality assessment on financial data. Studies in Communication Sciences, 4(2), 115-137.
Ballou, D. P., & Pazer, H. L. (1985). Modeling data and process quality in multiinput, multi-output information systems. Management science, 31(2), 150-162.
Ballou, D. P., & Tayi, G. K. (1989). Methodology for allocating resources for data quality enhancement. Communications of the ACM, 32(3), 320-329.
Barchard, K. A., & Pace, L. A. (2011). Preventing human error: The impact of data entry methods on data accuracy and statistical results. Computers in Human Behavior, 27(5), 1834-1839.
Batini, C., Barone, D., Mastrella, M., Maurino, A., & Ruffini, C. (2007). A Framework And A Methodology For Data Quality Assessment And Monitoring. In ICIQ (pp. 333- 346).
Batini, C., Cabitza, F., Cappiello, C., & Francalanci, C. (2008). A comprehensive data quality methodology for web and structured data. International Journal of Innovative Computing and Applications, 1(3), 205-218.
Batini, C., Cappiello, C., Francalanci, C., & Maurino, A. (2009). Methodologies for data quality assessment and improvement. ACM computing surveys (CSUR), 41(3), 1-52.
Cappiello, C., Ficiaro, P., & Pernici, B. (2006). HIQM: A Methodology for Information Quality Monitoring, Measurement, and Improvement. Lecture Notes in Computer Science, 339–351. doi:10.1007/11908883_41.
Carlo, B., Daniele, B., Federico, C., & Simone, G. (2011). A data quality methodology for heterogeneous data. International Journal of Database Management Systems, 3(1), 60-79.
Caro, A., Calero, C., & Piattini, M. (2007, November). A Portal Data Quality Model For Users And Developers. In ICIQ (pp. 462-476).
Cichy, C., & Rass, S. (2019). An overview of data quality frameworks. IEEE Access, 7, 24634-24648
Correa-Morales, J. C., & Barrera-Causil, C. (2021). Elicitation of the Parameters of Múltiple Linear Models. Revista Colombiana de Estadística, 44(1), 159-170.
Del Pilar Angeles, M., & García-Ugalde, F. (2009). A data quality practical approach. International Journal on Advances in Software Volume 1, Numbers 2&3, 2009.
Efron, B. (1994). Missing data, imputation, and the bootstrap. Journal of the American Statistical Association, 89(426), 463-475.
Elmagarmid, A. K., Ipeirotis, P. G., & Verykios, V. S. (2006). Duplicate record detection: A survey. IEEE Transactions on knowledge and data engineering, 19(1), 1-16.
English, L. P. (1999). Improving data warehouse and business information quality: methods for reducing costs and increasing profits. John Wiley & Sons, Inc..
Eppler, M., & Helfert, M. (2004, November). A classification and analysis of data quality costs. In International Conference on Information Quality (pp. 311-325).
Guadalupe, M. (2017, diciembre). Pruebas de bondad de ajuste. Área Académica: Licenciatura en Ingeniería Industrial. https://www.uaeh.edu.mx/docencia/P_Presentaciones/Sahagun/industrial/2017/Pr uebas_de_bondad_de_ajuste.pdf
Hernández, M. A., & Stolfo, S. J. (1998). Real-world data is dirty: Data cleansing and the merge/purge problem. Data mining and knowledge discovery, 2(1), 9-37.
Hickey, A. M., & Davis, A. M. (2003, January). Requirements elicitation and elicitation technique selection: model for two knowledge-intensive software development processes. In 36th Annual Hawaii International Conference on System Sciences, 2003. Proceedings of the (pp. 10-pp). IEEE.
Huh, Y. U., Keller, F. R., Redman, T. C., & Watkins, A. R. (1990). Data quality. Information and software technology, 32(8), 559-565.
Jeusfeld, M. A., Quix, C., & Jarke, M. (1998, November). Design and analysis of quality information for data warehouses. In International Conference on Conceptual Modeling (pp. 349-362). Springer, Berlin, Heidelberg.
Johnson, J. R., Leitch, R. A., & Neter, J. (1981). Characteristics of errors in accounts receivable and inventory audits. Accounting Review, 270-293.
KPMG, (2017). KPMG: Disrupt and Grow, 2017 Global CEO Outlook. [Online]. Available: https://assets.kpmg.com/content/dam/kpmg/xx/pdf/2017/06/2017-globalceo-outlook.pdf
Labeeb, K., Chowdhury, K. B. Q., Riha, R. B., Abedin, M. Z., Yesmin, S., & Khan, M. N. R. (2020, December). Pre-Processing Data In Weather Monitoring Application By Using Big Data Quality Framework. In 2020 IEEE International Women in Engineering (WIE) Conference on Electrical and Computer Engineering (WIECON-ECE) (pp. 284-287). IEEE. ▪
Laudon, K. C. (1986). Data quality and due process in large interorganizational record systems. Communications of the ACM, 29(1), 4-11.
Laudon, K. C. (1986). Data quality and due process in large interorganizational record systems. Communications of the ACM, 29(1), 4-11.
Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. (2002). AIMQ: a methodology for information quality assessment. Information & management, 40(2), 133-146.
Levitin, A., & Redman, T. (1995). Quality dimensions of a conceptual view. Information Processing & Management, 31(1), 81-88.
Long, J. A., Seko, C. E., & Wang, Y. R. (2005). A cyclic-hierarchical method for database data-quality evaluation and improvement. In Information quality. Routledge.
Loshin, D. (2001). Enterprise knowledge management: The data quality approach. Morgan Kaufmann.
Madnick, S. E., Wang, R. Y., Lee, Y. W., & Zhu, H. (2009). Overview and framework for data and information quality research. Journal of Data and Information Quality (JDIQ), 1(1), 1-22.
Marin, Y. (2022). Algoritmos para implementar calidad de datos en Python. Github. https://github.com/ydmarinb/calidad-datos.
Medina, F., & Galván, M. (2007). Imputación de datos: teoría y práctica. Cepal.
Moges, H. T., Van Vlasselaer, V., Lemahieu, W., & Baesens, B. (2016). Determining the use of data quality metadata (DQM) for decision making purposes and its impact on decision outcomes—An exploratory study. Decision Support Systems, 83, 32-46
Wand, Y., & Wang, R. Y. (1996). Anchoring data quality dimensions in ontological foundations. Communications of the ACM, 39(11), 86–95. doi:10.1145/240455.240479
Wang, R. Y. (1998). A product perspective on total data quality management. Communications of the ACM, 41(2), 58-65.
Wang, R. Y., & Strong, D. M. (1996). Beyond accuracy: What data quality means to data consumers. Journal of management information systems, 12(4), 5-33.
Wang, R. Y., Kon, H. B., & Madnick, S. E. (1993, April). Data quality requirements analysis and modeling. In Proceedings of IEEE 9th International Conference on Data Engineering (pp. 670-677). IEEE.
Wang, R. Y., Reddy, M. P., & Kon, H. B. (1995). Toward quality data: An attributebased approach. Decision support systems, 13(3-4), 349-372.
Wang, R. Y., Storey, V. C., & Firth, C. P. (1995). A framework for analysis of data quality research. IEEE transactions on knowledge and data engineering, 7(4), 623- 640.
Zhang, Z. (2016). Missing data imputation: focusing on single imputation. Annals of translational medicine, 4(1).
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 69 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
dc.publisher.program.spa.fl_str_mv Medellín - Minas - Doctorado en Ingeniería - Sistemas
dc.publisher.department.spa.fl_str_mv Departamento de la Computación y la Decisión
dc.publisher.faculty.spa.fl_str_mv Facultad de Minas
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
dc.publisher.branch.spa.fl_str_mv Universidad Nacional de Colombia - Sede Medellín
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/81466/1/1216722806.2022.pdf
https://repositorio.unal.edu.co/bitstream/unal/81466/2/license.txt
https://repositorio.unal.edu.co/bitstream/unal/81466/3/1216722806.2022.pdf.jpg
bitstream.checksum.fl_str_mv 72df9b16aaa478a2e1bee6a1a032bbde
8153f7789df02f0a4c9e079953658ab2
544fb863dd9f679ec78e8cfed646f32a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089629508304896
spelling Atribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Branch Bedoya, John Willian112eaa0bbeeaeb0d3d14dfe15d672a15600Iral Palomino, René5fb82abe453f9d95ad92ab69ba6c7c52600Marín Benjumea, Yubar Danielcf95f25aa27ddeebd4dd9c2ffb5418c52022-05-31T20:26:19Z2022-05-31T20:26:19Z2022https://repositorio.unal.edu.co/handle/unal/81466Universidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/ilustraciones, diagramas, tablasEn los últimos años, el aumento de toma de decisiones basadas en datos ha sufrido un aumento vertiginoso. Esto ha debelado un sin número de problemas relacionados con la calidad de los datos, dejando claro la importancia de contar con estrategias para mejorar y garantizar la calidad de los conjuntos de datos a la hora de implementar iniciativas de datos maestros. Esta investigación se centra en platear una metodología que permita evaluar y solucionar los problemas de calidad de datos directamente sobre los datos, dando en primer lugar una revisión y evaluación de los esfuerzos y metodología encontradas en la literatura, seguido por la presentación de la metodología propuesta y detallando los procesos para su implementación de manera inmediata y por último, realizando la implementación de la metodología en un conjunto de datos y presentando los resultados obtenidos en cada etapa. (Texto tomado de la fuente)In recent years, the rise of data-driven decision making has skyrocketed. This has led to several data quality issues, highlighting the importance of strategies to improve and ensure the quality of data sets when implementing master data initiatives. This research focuses on establishing a methodology that allows evaluating and solving data quality problems directly on the data, giving first a review and evaluation of the efforts and methodology found in the literature, followed by the presentation of the methodology and proposal. detailing the processes for its immediate implementation and finally, carrying out the implementation of the methodology in a data set and presenting the results obtained at each stage.MaestríaMagíster en Ingeniería - Ingeniería de SistemasÁrea Curricular de Ingeniería de Sistemas e Informática69 páginasapplication/pdfspaUniversidad Nacional de ColombiaMedellín - Minas - Doctorado en Ingeniería - SistemasDepartamento de la Computación y la DecisiónFacultad de MinasMedellín, ColombiaUniversidad Nacional de Colombia - Sede Medellín000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresDatosComprensión de datosCalidad de datosGestión de datos maestrosDimensiones de calidad de datosLimpieza de datosData qualityMaster data managementData quality dimensionsData cleaningMetodología para la gestión de la calidad de los datos empleando un enfoque data driven para implementar procesos de evaluación y mejoramiento de la calidad de los datos en iniciativas de gestión de datos maestrosMethodology for data quality management using a data driven approach to implement data quality assessment and improvement processes in master data management initiativesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMAmicis, F. D. (2004). A methodology for data quality assessment on financial data. Studies in Communication Sciences, 4(2), 115-137.Ballou, D. P., & Pazer, H. L. (1985). Modeling data and process quality in multiinput, multi-output information systems. Management science, 31(2), 150-162.Ballou, D. P., & Tayi, G. K. (1989). Methodology for allocating resources for data quality enhancement. Communications of the ACM, 32(3), 320-329.Barchard, K. A., & Pace, L. A. (2011). Preventing human error: The impact of data entry methods on data accuracy and statistical results. Computers in Human Behavior, 27(5), 1834-1839.Batini, C., Barone, D., Mastrella, M., Maurino, A., & Ruffini, C. (2007). A Framework And A Methodology For Data Quality Assessment And Monitoring. In ICIQ (pp. 333- 346).Batini, C., Cabitza, F., Cappiello, C., & Francalanci, C. (2008). A comprehensive data quality methodology for web and structured data. International Journal of Innovative Computing and Applications, 1(3), 205-218.Batini, C., Cappiello, C., Francalanci, C., & Maurino, A. (2009). Methodologies for data quality assessment and improvement. ACM computing surveys (CSUR), 41(3), 1-52.Cappiello, C., Ficiaro, P., & Pernici, B. (2006). HIQM: A Methodology for Information Quality Monitoring, Measurement, and Improvement. Lecture Notes in Computer Science, 339–351. doi:10.1007/11908883_41.Carlo, B., Daniele, B., Federico, C., & Simone, G. (2011). A data quality methodology for heterogeneous data. International Journal of Database Management Systems, 3(1), 60-79.Caro, A., Calero, C., & Piattini, M. (2007, November). A Portal Data Quality Model For Users And Developers. In ICIQ (pp. 462-476).Cichy, C., & Rass, S. (2019). An overview of data quality frameworks. IEEE Access, 7, 24634-24648Correa-Morales, J. C., & Barrera-Causil, C. (2021). Elicitation of the Parameters of Múltiple Linear Models. Revista Colombiana de Estadística, 44(1), 159-170.Del Pilar Angeles, M., & García-Ugalde, F. (2009). A data quality practical approach. International Journal on Advances in Software Volume 1, Numbers 2&3, 2009.Efron, B. (1994). Missing data, imputation, and the bootstrap. Journal of the American Statistical Association, 89(426), 463-475.Elmagarmid, A. K., Ipeirotis, P. G., & Verykios, V. S. (2006). Duplicate record detection: A survey. IEEE Transactions on knowledge and data engineering, 19(1), 1-16.English, L. P. (1999). Improving data warehouse and business information quality: methods for reducing costs and increasing profits. John Wiley & Sons, Inc..Eppler, M., & Helfert, M. (2004, November). A classification and analysis of data quality costs. In International Conference on Information Quality (pp. 311-325).Guadalupe, M. (2017, diciembre). Pruebas de bondad de ajuste. Área Académica: Licenciatura en Ingeniería Industrial. https://www.uaeh.edu.mx/docencia/P_Presentaciones/Sahagun/industrial/2017/Pr uebas_de_bondad_de_ajuste.pdfHernández, M. A., & Stolfo, S. J. (1998). Real-world data is dirty: Data cleansing and the merge/purge problem. Data mining and knowledge discovery, 2(1), 9-37.Hickey, A. M., & Davis, A. M. (2003, January). Requirements elicitation and elicitation technique selection: model for two knowledge-intensive software development processes. In 36th Annual Hawaii International Conference on System Sciences, 2003. Proceedings of the (pp. 10-pp). IEEE.Huh, Y. U., Keller, F. R., Redman, T. C., & Watkins, A. R. (1990). Data quality. Information and software technology, 32(8), 559-565.Jeusfeld, M. A., Quix, C., & Jarke, M. (1998, November). Design and analysis of quality information for data warehouses. In International Conference on Conceptual Modeling (pp. 349-362). Springer, Berlin, Heidelberg.Johnson, J. R., Leitch, R. A., & Neter, J. (1981). Characteristics of errors in accounts receivable and inventory audits. Accounting Review, 270-293.KPMG, (2017). KPMG: Disrupt and Grow, 2017 Global CEO Outlook. [Online]. Available: https://assets.kpmg.com/content/dam/kpmg/xx/pdf/2017/06/2017-globalceo-outlook.pdfLabeeb, K., Chowdhury, K. B. Q., Riha, R. B., Abedin, M. Z., Yesmin, S., & Khan, M. N. R. (2020, December). Pre-Processing Data In Weather Monitoring Application By Using Big Data Quality Framework. In 2020 IEEE International Women in Engineering (WIE) Conference on Electrical and Computer Engineering (WIECON-ECE) (pp. 284-287). IEEE. ▪Laudon, K. C. (1986). Data quality and due process in large interorganizational record systems. Communications of the ACM, 29(1), 4-11.Laudon, K. C. (1986). Data quality and due process in large interorganizational record systems. Communications of the ACM, 29(1), 4-11.Lee, Y. W., Strong, D. M., Kahn, B. K., & Wang, R. Y. (2002). AIMQ: a methodology for information quality assessment. Information & management, 40(2), 133-146.Levitin, A., & Redman, T. (1995). Quality dimensions of a conceptual view. Information Processing & Management, 31(1), 81-88.Long, J. A., Seko, C. E., & Wang, Y. R. (2005). A cyclic-hierarchical method for database data-quality evaluation and improvement. In Information quality. Routledge.Loshin, D. (2001). Enterprise knowledge management: The data quality approach. Morgan Kaufmann.Madnick, S. E., Wang, R. Y., Lee, Y. W., & Zhu, H. (2009). Overview and framework for data and information quality research. Journal of Data and Information Quality (JDIQ), 1(1), 1-22.Marin, Y. (2022). Algoritmos para implementar calidad de datos en Python. Github. https://github.com/ydmarinb/calidad-datos.Medina, F., & Galván, M. (2007). Imputación de datos: teoría y práctica. Cepal.Moges, H. T., Van Vlasselaer, V., Lemahieu, W., & Baesens, B. (2016). Determining the use of data quality metadata (DQM) for decision making purposes and its impact on decision outcomes—An exploratory study. Decision Support Systems, 83, 32-46Wand, Y., & Wang, R. Y. (1996). Anchoring data quality dimensions in ontological foundations. Communications of the ACM, 39(11), 86–95. doi:10.1145/240455.240479Wang, R. Y. (1998). A product perspective on total data quality management. Communications of the ACM, 41(2), 58-65.Wang, R. Y., & Strong, D. M. (1996). Beyond accuracy: What data quality means to data consumers. Journal of management information systems, 12(4), 5-33.Wang, R. Y., Kon, H. B., & Madnick, S. E. (1993, April). Data quality requirements analysis and modeling. In Proceedings of IEEE 9th International Conference on Data Engineering (pp. 670-677). IEEE.Wang, R. Y., Reddy, M. P., & Kon, H. B. (1995). Toward quality data: An attributebased approach. Decision support systems, 13(3-4), 349-372.Wang, R. Y., Storey, V. C., & Firth, C. P. (1995). A framework for analysis of data quality research. IEEE transactions on knowledge and data engineering, 7(4), 623- 640.Zhang, Z. (2016). Missing data imputation: focusing on single imputation. Annals of translational medicine, 4(1).EstudiantesInvestigadoresORIGINAL1216722806.2022.pdf1216722806.2022.pdfTesis de Maestría en Ingeniería - Ingeniería de Sistemasapplication/pdf1198707https://repositorio.unal.edu.co/bitstream/unal/81466/1/1216722806.2022.pdf72df9b16aaa478a2e1bee6a1a032bbdeMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-84074https://repositorio.unal.edu.co/bitstream/unal/81466/2/license.txt8153f7789df02f0a4c9e079953658ab2MD52THUMBNAIL1216722806.2022.pdf.jpg1216722806.2022.pdf.jpgGenerated Thumbnailimage/jpeg5513https://repositorio.unal.edu.co/bitstream/unal/81466/3/1216722806.2022.pdf.jpg544fb863dd9f679ec78e8cfed646f32aMD53unal/81466oai:repositorio.unal.edu.co:unal/814662024-08-06 23:09:49.1Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.coUExBTlRJTExBIERFUMOTU0lUTwoKQ29tbyBlZGl0b3IgZGUgZXN0ZSDDrXRlbSwgdXN0ZWQgcHVlZGUgbW92ZXJsbyBhIHJldmlzacOzbiBzaW4gYW50ZXMgcmVzb2x2ZXIgbG9zIHByb2JsZW1hcyBpZGVudGlmaWNhZG9zLCBkZSBsbyBjb250cmFyaW8sIGhhZ2EgY2xpYyBlbiBHdWFyZGFyIHBhcmEgZ3VhcmRhciBlbCDDrXRlbSB5IHNvbHVjaW9uYXIgZXN0b3MgcHJvYmxlbWFzIG1hcyB0YXJkZS4KClBhcmEgdHJhYmFqb3MgZGVwb3NpdGFkb3MgcG9yIHN1IHByb3BpbyBhdXRvcjoKIApBbCBhdXRvYXJjaGl2YXIgZXN0ZSBncnVwbyBkZSBhcmNoaXZvcyBkaWdpdGFsZXMgeSBzdXMgbWV0YWRhdG9zLCB5byBnYXJhbnRpem8gYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBVbmFsIGVsIGRlcmVjaG8gYSBhbG1hY2VuYXJsb3MgeSBtYW50ZW5lcmxvcyBkaXNwb25pYmxlcyBlbiBsw61uZWEgZGUgbWFuZXJhIGdyYXR1aXRhLiBEZWNsYXJvIHF1ZSBsYSBvYnJhIGVzIGRlIG1pIHByb3BpZWRhZCBpbnRlbGVjdHVhbCB5IHF1ZSBlbCBSZXBvc2l0b3JpbyBJbnN0aXR1Y2lvbmFsIFVuYWwgbm8gYXN1bWUgbmluZ3VuYSByZXNwb25zYWJpbGlkYWQgc2kgaGF5IGFsZ3VuYSB2aW9sYWNpw7NuIGEgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGFsIGRpc3RyaWJ1aXIgZXN0b3MgYXJjaGl2b3MgeSBtZXRhZGF0b3MuIChTZSByZWNvbWllbmRhIGEgdG9kb3MgbG9zIGF1dG9yZXMgYSBpbmRpY2FyIHN1cyBkZXJlY2hvcyBkZSBhdXRvciBlbiBsYSBww6FnaW5hIGRlIHTDrXR1bG8gZGUgc3UgZG9jdW1lbnRvLikgRGUgbGEgbWlzbWEgbWFuZXJhLCBhY2VwdG8gbG9zIHTDqXJtaW5vcyBkZSBsYSBzaWd1aWVudGUgbGljZW5jaWE6IExvcyBhdXRvcmVzIG8gdGl0dWxhcmVzIGRlbCBkZXJlY2hvIGRlIGF1dG9yIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8gY29uZmllcmVuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSwgbGltaXRhZGEgeSBncmF0dWl0YSBzb2JyZSBsYSBvYnJhIHF1ZSBzZSBpbnRlZ3JhIGVuIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwsIHF1ZSBzZSBhanVzdGEgYSBsYXMgc2lndWllbnRlcyBjYXJhY3RlcsOtc3RpY2FzOiBhKSBFc3RhcsOhIHZpZ2VudGUgYSBwYXJ0aXIgZGUgbGEgZmVjaGEgZW4gcXVlIHNlIGluY2x1eWUgZW4gZWwgcmVwb3NpdG9yaW8sIHF1ZSBzZXLDoW4gcHJvcnJvZ2FibGVzIGluZGVmaW5pZGFtZW50ZSBwb3IgZWwgdGllbXBvIHF1ZSBkdXJlIGVsIGRlcmVjaG8gcGF0cmltb25pYWwgZGVsIGF1dG9yLiBFbCBhdXRvciBwb2Ryw6EgZGFyIHBvciB0ZXJtaW5hZGEgbGEgbGljZW5jaWEgc29saWNpdMOhbmRvbG8gYSBsYSBVbml2ZXJzaWRhZC4gYikgTG9zIGF1dG9yZXMgYXV0b3JpemFuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgcGFyYSBwdWJsaWNhciBsYSBvYnJhIGVuIGVsIGZvcm1hdG8gcXVlIGVsIHJlcG9zaXRvcmlvIGxvIHJlcXVpZXJhIChpbXByZXNvLCBkaWdpdGFsLCBlbGVjdHLDs25pY28gbyBjdWFscXVpZXIgb3RybyBjb25vY2lkbyBvIHBvciBjb25vY2VyKSB5IGNvbm9jZW4gcXVlIGRhZG8gcXVlIHNlIHB1YmxpY2EgZW4gSW50ZXJuZXQgcG9yIGVzdGUgaGVjaG8gY2lyY3VsYSBjb24gYWxjYW5jZSBtdW5kaWFsLiBjKSBMb3MgYXV0b3JlcyBhY2VwdGFuIHF1ZSBsYSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgYSB0w610dWxvIGdyYXR1aXRvLCBwb3IgbG8gdGFudG8sIHJlbnVuY2lhbiBhIHJlY2liaXIgZW1vbHVtZW50byBhbGd1bm8gcG9yIGxhIHB1YmxpY2FjacOzbiwgZGlzdHJpYnVjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSB5IGN1YWxxdWllciBvdHJvIHVzbyBxdWUgc2UgaGFnYSBlbiBsb3MgdMOpcm1pbm9zIGRlIGxhIHByZXNlbnRlIGxpY2VuY2lhIHkgZGUgbGEgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBjb24gcXVlIHNlIHB1YmxpY2EuIGQpIExvcyBhdXRvcmVzIG1hbmlmaWVzdGFuIHF1ZSBzZSB0cmF0YSBkZSB1bmEgb2JyYSBvcmlnaW5hbCBzb2JyZSBsYSBxdWUgdGllbmVuIGxvcyBkZXJlY2hvcyBxdWUgYXV0b3JpemFuIHkgcXVlIHNvbiBlbGxvcyBxdWllbmVzIGFzdW1lbiB0b3RhbCByZXNwb25zYWJpbGlkYWQgcG9yIGVsIGNvbnRlbmlkbyBkZSBzdSBvYnJhIGFudGUgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgeSBhbnRlIHRlcmNlcm9zLiBFbiB0b2RvIGNhc28gbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgc2UgY29tcHJvbWV0ZSBhIGluZGljYXIgc2llbXByZSBsYSBhdXRvcsOtYSBpbmNsdXllbmRvIGVsIG5vbWJyZSBkZWwgYXV0b3IgeSBsYSBmZWNoYSBkZSBwdWJsaWNhY2nDs24uIGUpIExvcyBhdXRvcmVzIGF1dG9yaXphbiBhIGxhIFVuaXZlcnNpZGFkIHBhcmEgaW5jbHVpciBsYSBvYnJhIGVuIGxvcyBhZ3JlZ2Fkb3JlcywgaW5kaWNlc3MgeSBidXNjYWRvcmVzIHF1ZSBzZSBlc3RpbWVuIG5lY2VzYXJpb3MgcGFyYSBwcm9tb3ZlciBzdSBkaWZ1c2nDs24uIGYpIExvcyBhdXRvcmVzIGFjZXB0YW4gcXVlIGxhIFVuaXZlcnNpZGFkIE5hY2lvbmFsIGRlIENvbG9tYmlhIHB1ZWRhIGNvbnZlcnRpciBlbCBkb2N1bWVudG8gYSBjdWFscXVpZXIgbWVkaW8gbyBmb3JtYXRvIHBhcmEgcHJvcMOzc2l0b3MgZGUgcHJlc2VydmFjacOzbiBkaWdpdGFsLiBTSSBFTCBET0NVTUVOVE8gU0UgQkFTQSBFTiBVTiBUUkFCQUpPIFFVRSBIQSBTSURPIFBBVFJPQ0lOQURPIE8gQVBPWUFETyBQT1IgVU5BIEFHRU5DSUEgTyBVTkEgT1JHQU5JWkFDScOTTiwgQ09OIEVYQ0VQQ0nDk04gREUgTEEgVU5JVkVSU0lEQUQgTkFDSU9OQUwgREUgQ09MT01CSUEsIExPUyBBVVRPUkVTIEdBUkFOVElaQU4gUVVFIFNFIEhBIENVTVBMSURPIENPTiBMT1MgREVSRUNIT1MgWSBPQkxJR0FDSU9ORVMgUkVRVUVSSURPUyBQT1IgRUwgUkVTUEVDVElWTyBDT05UUkFUTyBPIEFDVUVSRE8uIAoKUGFyYSB0cmFiYWpvcyBkZXBvc2l0YWRvcyBwb3Igb3RyYXMgcGVyc29uYXMgZGlzdGludGFzIGEgc3UgYXV0b3I6IAoKRGVjbGFybyBxdWUgZWwgZ3J1cG8gZGUgYXJjaGl2b3MgZGlnaXRhbGVzIHkgbWV0YWRhdG9zIGFzb2NpYWRvcyBxdWUgZXN0b3kgYXJjaGl2YW5kbyBlbiBlbCBSZXBvc2l0b3JpbyBJbnN0aXR1Y2lvbmFsIFVOKSBlcyBkZSBkb21pbmlvIHDDumJsaWNvLiBTaSBubyBmdWVzZSBlbCBjYXNvLCBhY2VwdG8gdG9kYSBsYSByZXNwb25zYWJpbGlkYWQgcG9yIGN1YWxxdWllciBpbmZyYWNjacOzbiBkZSBkZXJlY2hvcyBkZSBhdXRvciBxdWUgY29ubGxldmUgbGEgZGlzdHJpYnVjacOzbiBkZSBlc3RvcyBhcmNoaXZvcyB5IG1ldGFkYXRvcy4KTk9UQTogU0kgTEEgVEVTSVMgQSBQVUJMSUNBUiBBRFFVSVJJw5MgQ09NUFJPTUlTT1MgREUgQ09ORklERU5DSUFMSURBRCBFTiBFTCBERVNBUlJPTExPIE8gUEFSVEVTIERFTCBET0NVTUVOVE8uIFNJR0EgTEEgRElSRUNUUklaIERFIExBIFJFU09MVUNJw5NOIDAyMyBERSAyMDE1LCBQT1IgTEEgQ1VBTCBTRSBFU1RBQkxFQ0UgRUwgUFJPQ0VESU1JRU5UTyBQQVJBIExBIFBVQkxJQ0FDScOTTiBERSBURVNJUyBERSBNQUVTVFLDjUEgWSBET0NUT1JBRE8gREUgTE9TIEVTVFVESUFOVEVTIERFIExBIFVOSVZFUlNJREFEIE5BQ0lPTkFMIERFIENPTE9NQklBIEVOIEVMIFJFUE9TSVRPUklPIElOU1RJVFVDSU9OQUwgVU4sIEVYUEVESURBIFBPUiBMQSBTRUNSRVRBUsONQSBHRU5FUkFMLiAqTEEgVEVTSVMgQSBQVUJMSUNBUiBERUJFIFNFUiBMQSBWRVJTScOTTiBGSU5BTCBBUFJPQkFEQS4gCgpBbCBoYWNlciBjbGljIGVuIGVsIHNpZ3VpZW50ZSBib3TDs24sIHVzdGVkIGluZGljYSBxdWUgZXN0w6EgZGUgYWN1ZXJkbyBjb24gZXN0b3MgdMOpcm1pbm9zLiBTaSB0aWVuZSBhbGd1bmEgZHVkYSBzb2JyZSBsYSBsaWNlbmNpYSwgcG9yIGZhdm9yLCBjb250YWN0ZSBjb24gZWwgYWRtaW5pc3RyYWRvciBkZWwgc2lzdGVtYS4KClVOSVZFUlNJREFEIE5BQ0lPTkFMIERFIENPTE9NQklBIC0gw5psdGltYSBtb2RpZmljYWNpw7NuIDE5LzEwLzIwMjEK