Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas

Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; e...

Full description

Autores:
Londoño Ocampo, Manuela
Tipo de recurso:
Fecha de publicación:
2020
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/79641
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/79641
https://repositorio.unal.edu.co/
Palabra clave:
000 - Ciencias de la computación, información y obras generales
Enfermedades cardíacas - Diagnóstico
Informática en salud
Aprendizaje de máquinas
Riesgo cardiovascular
Informática de la salud
Machine Learning
cardiovascular risk
Health informatics
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
id UNACIONAL2_dce8679c3b92326277bb57a71fe849ef
oai_identifier_str oai:repositorio.unal.edu.co:unal/79641
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
dc.title.translated.eng.fl_str_mv Definition of a cardiovascular risk classification model for a population of older adults using machine learning techniques
title Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
spellingShingle Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
000 - Ciencias de la computación, información y obras generales
Enfermedades cardíacas - Diagnóstico
Informática en salud
Aprendizaje de máquinas
Riesgo cardiovascular
Informática de la salud
Machine Learning
cardiovascular risk
Health informatics
title_short Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
title_full Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
title_fullStr Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
title_full_unstemmed Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
title_sort Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
dc.creator.fl_str_mv Londoño Ocampo, Manuela
dc.contributor.advisor.none.fl_str_mv Villa Garzón, Fernán Alonso
dc.contributor.author.none.fl_str_mv Londoño Ocampo, Manuela
dc.subject.ddc.spa.fl_str_mv 000 - Ciencias de la computación, información y obras generales
topic 000 - Ciencias de la computación, información y obras generales
Enfermedades cardíacas - Diagnóstico
Informática en salud
Aprendizaje de máquinas
Riesgo cardiovascular
Informática de la salud
Machine Learning
cardiovascular risk
Health informatics
dc.subject.lemb.none.fl_str_mv Enfermedades cardíacas - Diagnóstico
Informática en salud
dc.subject.proposal.spa.fl_str_mv Aprendizaje de máquinas
Riesgo cardiovascular
Informática de la salud
dc.subject.proposal.eng.fl_str_mv Machine Learning
cardiovascular risk
Health informatics
description Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; en Colombia la situación es similar. Para la estimación del riesgo cardiovascular se han creado diferentes métodos que analizan el desarrollo de este tipo de enfermedades según el grado de exposición a algunos factores de riesgo, pero estos no suelen ser precisos en todas las poblaciones. El aprendizaje de máquinas ha demostrado su valor de aplicación en contextos médicos, siendo una herramienta novedosa y alternativa que apoya tareas complejas como el diagnóstico de enfermedades. En el presente trabajo se consideran tres modelos de aprendizaje de máquinas, usados en tareas de clasificación que, según la revisión de la literatura desarrollada, pueden ser óptimos en información clínica, con lo que se pretende identificar para una población colombiana de adultos mayores el riesgo asociado al padecimiento de enfermedades cardiovasculares. Para la evaluación del desempeño de los modelos propuestos se utilizan criterios de bondad de ajuste como exactitud, sensibilidad, precisión y f1-score, donde el modelo óptimo se obtiene con el algoritmo de máquina de aumento de gradiente, con un rendimiento mejor a los reportados por estudios similares referenciados.
publishDate 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-06-16T16:54:06Z
dc.date.available.none.fl_str_mv 2021-06-16T16:54:06Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/79641
dc.identifier.instname.spa.fl_str_mv Universidad Nacional de Colombia
dc.identifier.reponame.spa.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
dc.identifier.repourl.spa.fl_str_mv https://repositorio.unal.edu.co/
url https://repositorio.unal.edu.co/handle/unal/79641
https://repositorio.unal.edu.co/
identifier_str_mv Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.indexed.spa.fl_str_mv LaReferencia
dc.relation.references.spa.fl_str_mv Akoglu, H. (2018). User’s guide to correlation coefficients. Turkish Journal of Emergency Medicine, 18(3), 91–93. https://doi.org/https://doi.org/10.1016/j.tjem.2018.08.001
Alaa, A. M., Bolton, T., Di Angelantonio, E., Rudd, J. H. F., & van der Schaar, M. (2019). Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLOS ONE, 14(5), e0213653. https://doi.org/10.1371/journal.pone.0213653
Alizadehsani, R., Roshanzamir, M., Hussain, S., Khosravi, A., Koohestani, A., Zangooei, M. H., Abdar, M., Beykikhoshk, A., Shoeibi, A., Zare, A., Panahiazar, M., Nahavandi, S., Srinivasan, D., Atiya, A. F., & Acharya, U. R. (2020). Handling of uncertainty in medical data using machine learning and probability theory techniques: A review of 30 years (1991-2020). http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2008.10114&lang=es&site=eds-live
Alonso, J. C., & Munoz, A. F. (2014). Interpretación de variables Dummy en modelos loglin. Apuntes de Economıa No. 40.
Álvarez Ceballos, J. C., Álvarez Múñoz, A., Carvajal Gutiérrez, W., González, M. M., Duque, J. L., & Nieto Cárdenas, O. A. (2017). Determinación del riesgo cardiovascular en una población. Revista Colombiana de Cardiologia, 24(4), 334–341. https://doi.org/10.1016/j.rccar.2016.08.002
Álvarez Cosmea, A. (2001). Las tablas de riesgo cardiovascular: Una revisión crítica. MEDIFAM, 11(3), 122–139. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1131-57682001000300002
Amón Uribe, I. (2010). Guía metodológica para la selección de técnicas de depuración de datos [Tesis de maestría]. Universidad Nacional de Colombia.
Ashfaq, A., & Nowaczyk, S. (2019). Machine learning in healthcare - a system’s perspective. In A. V. B. Aditya Prakash Shweta Bansal, Adam Sadelik (Ed.), Proceedings of the ACM SIGKDD Workshop on Epidemiology meets Data Mining and Knowledge Discovery (epiDAMIK) (pp. 14–17). http://hh.diva-portal.org/smash/get/diva2:1342677/FULLTEXT01.pdf
Avila-Chaurand, R., Prado-León, L. R., & González-Muñoz, E. L. (2001). Dimensiones antropométricas de la población latinoamericana: México, Cuba, Colombia, Chile. Centro Universitario de Arte, Arquitectura y Diseño, UDG. 1a Ed. Guadalajara Jalisco.
Bandyopadhyay, S., Wolfson, J., Vock, D. M., Vazquez-Benitez, G., Adomavicius, G., Elidrisi, M., Johnson, P. E., & O’Connor, P. J. (2015). Data mining for censored time-to-event data: a Bayesian network model for predicting cardiovascular risk from electronic health record data. Data Mining and Knowledge Discovery, 29(4), 1033–1069. https://doi.org/10.1007/s10618-014-0386-6
Basu, T., Engel-Wolf, S., & Menzer, O. (2020). The ethics of machine learning in medical sciences: Where do we stand today? Indian Journal of Dermatology, 65(5), 358–364. http://10.0.16.7/ijd.IJD_419_20
Beard, J., Officer, A., Cassels, A., Bustreo, F., Worning, A. M., & Asamoa-Baah, A. (2015). Informe mundial sobre el envejecimiento y la salud. OMS.
Bedoya-Mejía, S., Henao-Valencia, C., & Cardona-Arango, D. (2019). Mortalidad por enfermedades del sistema circulatorio, en los municipios del área metropolitana, Antioquia, 1998-2014. Revista Facultad Nacional de Salud Pública, 37(1), 96–105.
Bellamy, D., Celi, L., & Beam, A. L. (2020). Evaluating Progress on Machine Learning for Longitudinal Electronic Healthcare Data. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2010.01149&lang=es&site=eds-live
Bengio, S., Weston, J., & Grangier, D. (2010). Label Embedding Trees for Large Multi-Class Tasks. In J. Lafferty, C. Williams, J. Shawe-Taylor, R. Zemel, & A. Culotta (Eds.), Advances in Neural Information Processing Systems (Vol. 23, pp. 163–171). Curran Associates, Inc. https://proceedings.neurips.cc/paper/2010/file/06138bc5af6023646ede0e1f7c1eac75-Paper.pdf
Berthold, M., Cebron, N., Dill, F., Gabriel, T., Kötter, T., Meinl, T., Ohl, P., Thiel, K., & Wiswedel, B. (2009). KNIME - The Konstanz information miner : Version 2.0 and Beyond. SIGKDD Explorations, 11, 26–31.
Bhatti, S., Kehar, V., & Memon, M. A. (2020). Prognosis of Diabetes by Performing Data Mining of HbA1c. International Journal of Computer Science and Information Security (IJCSIS), 18(1).
Blagus, R., & Lusa, L. (2013). SMOTE for high-dimensional class-imbalanced data. BMC Bioinformatics, 14, 106. https://doi.org/10.1186/1471-2105-14-106
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32.
Cardona Alzate, N. I. (2019). Predicción y selección de variables con bosques aleatorios en presencia de variables correlacionadas [Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/bitstream/handle/unal/75561/8063120.2019.pdf?sequence=1
Castellanos Vázquez, J., Moreno, A. S., Herrera, C. B., & Sautto Vallejo, J. M. (2019). Valoración de riesgo cardiovascular mediante modelos de clasificación. Investigación Operacional, 40(1), 80–87. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=133858008&lang=es&site=eds-live
Chitarroni, H. (2002). La regresión logística. http://www.salvador.edu.ar/csoc/idicso
Ley 1581 de 2012 - Ley Estatutaria de Hábeas Data, (2012). http://bibliotecadigital.ccb.org.co/bitstream/handle/11520/13629/Ley 1581 de 2012.pdf?sequence=1
Cosma, G., Acampora, G., Brown, D., Rees, R. C., Khan, M., & Pockley, A. G. (2016). Prediction of Pathological Stage in Patients with Prostate Cancer: A Neuro-Fuzzy Model. PLOS ONE, 11(6), e0155856. https://doi.org/10.1371/journal.pone.0155856
Das, R. (2010). A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert Systems with Applications, 37(2), 1568–1572. https://doi.org/10.1016/j.eswa.2009.06.040
Díaz-Realpe, J. E., Muñoz-Martínez, J., & Sierra-Torres, C. H. (2007). Factores de riesgo para enfermedad cardiovascular en trabajadores de una institución prestadora de servicios de salud, Colombia. Revista de Salud Pública, 9, 64–75.
Estrada, J., Camacho, J. A., Restrepo, M. T., & Parra, C. M. (1998). Parámetros antropométricos de la población laboral colombiana, 1995. Revista Facultad Nacional de Salud Pública, 32, 64–78.
Fernando, M., & Arrieta, C. (2005). Estudio sociológico y del conocimiento de los factores de riesgo de las enfermedades cardiovasculares en la Costa Caribe Colombiana (Estudio Caribe). Revista Colombiana de Cardiología, 12, 122–128.
Gislason, P. O., Benediktsson, J. A., & Sveinsson, J. R. (2005). Random Forests for land cover classification. Pattern Recognition Letters, 27, 294–300. https://doi.org/10.1016/j.patrec.2005.08.011
Gómez, L. A. (2011). Las enfermedades cardiovasculares: un problema de salud pública y un reto global. Biomédica, 31(4).
Hameed, N., Shabut, A. M., Ghosh, M. K., & Hossain, M. A. (2020). Multi-class multi-level classification algorithm for skin lesions classification using machine learning techniques. Expert Systems with Applications, 141, 112961. https://doi.org/10.1016/j.eswa.2019.112961
Instituto Nacional de Salud de Colombia (INS). (2013). Observatorio Nacional de Salud (ONS) Boletín N0.1. https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/IA/INS/Boletin-tecnico-1-ONS.pdf
Jamthikar, A., Gupta, D., Khanna, N. N., Saba, L., Laird, J. R., & Suri, J. S. (2020). Cardiovascular/stroke risk prevention: A new machine learning framework integrating carotid ultrasound image-based phenotypes and its harmonics with conventional risk factors. Indian Heart Journal, 72(4), 258–264. https://doi.org/https://doi.org/10.1016/j.ihj.2020.06.004
Kalantari, A., Kamsin, A., Shamshirbandb, S., Gani, A., Alinejad Rokny, H., & Chronopoulos, A. T. (2018). Computational intelligence approaches for classification of medical data: State-of-the-art, future challenges and research directions. Neurocomputing, 276.
Khan, S. U., Islam, N., Jan, Z., Din, I. U., Khan, A., & Faheem, Y. (2019). An e-Health care services framework for the detection and classification of breast cancer in breast cytology images as an IoMT application. Future Generation Computer Systems, 98, 286–296. https://doi.org/10.1016/j.future.2019.01.033
Lemaître, G., Nogueira, F., & Aridas, C. K. (2017). Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. The Journal of Machine Learning Research, 18(1), 559–563.
Llibre Guerra, J. C., Guerra Hernández, M. A., & Perera Miniet, E. (2008). Comportamiento de las enfermedades crónicas no transmisibles en adultos mayores. Revista Cubana de Medicina General Integral, 24(4), 0.
Lobos Bejarano, J. M., & Brotons Cuixart, C. (2011). Factores de riesgo cardiovascular y atención primaria: evaluación e intervención. Atención Primaria, 43(12), 668–677. https://doi.org/https://doi.org/10.1016/j.aprim.2011.10.002
Lopera, M. M. (2017). Revisión comentada de la legislación colombiana en ética de la investigación en salud. Biomedica, 37(4), 1–44. https://doi.org/10.7705/biomedica.v37i4.3333
López-Martínez, F., Núñez-Valdez, E. R., García-Díaz, V., & Bursac, Z. (2020). A Case Study for a Big Data and Machine Learning Platform to Improve Medical Decision Support in Population Health Management. Algorithms, 13(4), 102. http://10.0.13.62/a13040102
Loreto, M., Lisboa, T., & Moreira, V. P. (2020). Early prediction of ICU readmissions using classification algorithms. Computers in Biology and Medicine, 118, 103636. https://doi.org/10.1016/j.compbiomed.2020.103636
Luengo Pérez, L. M., Urbano Gálvez, J. M., & Pérez Miranda, M. (2009). Validación de índices antropométricos alternativos como marcadores del riesgo cardiovascular. Endocrinologia y Nutricion, 56(9), 439–446. https://doi.org/10.1016/S1575-0922(09)72964-X
Ma, H., Wang, L., & Shen, B. (2011). A new fuzzy support vector machines for class imbalance learning. 2011 International Conference on Electrical and Control Engineering, 3781–3784. https://doi.org/10.1109/ICECENG.2011.6056838
Martínez, E. A. B., Ramírez, A. F., & Villamil, E. S. (2016). Modelos predictivos de riesgo cardiovascular. Revista Cuarzo, 22(2), 80–91.
Melillo, P., Izzo, R., Orrico, A., Scala, P., Attanasio, M., Mirra, M., De Luca, N., & Pecchia, L. (2015). Automatic Prediction of Cardiovascular and Cerebrovascular Events Using Heart Rate Variability Analysis. PLoS ONE, 10(3), 1–14. http://10.0.5.91/journal.pone.0118504
Mierswa, I., Wurst, M., Klinkenberg, R., Scholz, M., & Euler, T. (2006). YALE: Rapid Prototyping for Complex Data Mining Tasks. In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Vol. 2006). https://doi.org/10.1145/1150402.1150531
Resolucion 8430 de 1993, (1993). Ministerio de Salud y Protección Social de Colombia. (2013). Envejecimiento demográfico. Colombia 1951-2020 dinámica demográfica y estructuras poblacionales.
Moine, J. M. (2013). Metodologías para el descubrimiento de conocimiento en bases de datos: un estudio comparativo.
Monroy-de-Jesús, J., Guadalupe-Ramírez, A., Ambriz-Polo, J., & López-González, E. (2018). Algoritmo de aprendizaje eficiente para tratar el problema del desbalance de múltiples clases. Research in Computing Science, 147, 143–157. https://doi.org/10.13053/rcs-147-5-11
Muñoz, O. M., García, Á. A., Fernández-Ávila, D., Higuera, A., Ruiz, Á. J., Aschner, P., Toro, J. M., Arteaga, J. M., Merchán, A., Sánchez, G., & Villalba, Y. (2015). Guía de práctica clínica para la prevención, detección temprana, diagnóstico, tratamiento y seguimiento de las dislipidemias: evaluación del riesgo cardiovascular. Revista Colombiana de Cardiología, 22(6), 263–269. https://doi.org/https://doi.org/10.1016/j.rccar.2015.04.009
Muñoz, O. M., Rodríguez, N. I., Ruiz, Á., & Rondón, M. (2014). Validación de los modelos de predicción de Framingham y PROCAM como estimadores del riesgo cardiovascular en una población colombiana. Revista Colombiana de Cardiología, 21(4), 202–212. https://doi.org/https://doi.org/10.1016/j.rccar.2014.02.001
Muñoz V, O. M., Ruiz Morales, Á. J., Mariño Correa, A., & Bustos C., M. M. (2017). Concordancia entre los modelos de SCORE y Framingham y las ecuaciones AHA/ACC como evaluadores de riesgo cardiovascular. Revista Colombiana de Cardiología, 24(2), 110–116. https://doi.org/https://doi.org/10.1016/j.rccar.2016.06.013
Navarro Céspedes, J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para Datos Categóricos. Aplicación en HTA. . Universidad Central “Marta Abreu” de Las Villas.
O’Donnell, C. J., & Elosua, R. (2008). Cardiovascular risk factors. Insights from framingham heart study. Revista Espanola de Cardiologia, 61(3), 299–310. https://doi.org/10.1157/13116658
OMS. (2008). Prevención de las enfermedades cardiovasculares: guía de bolsillo para la estimación y el manejo del riesgo cardiovascular. Organización Mundial de la Salud.
OMS. (2014). Global status report on noncommunicable diseases 2014 (Issue WHO/NMH/NVI/15.1). World Health Organization.
Otero, J., & Sánchez, L. (2007). Disenos experimentales y tests estadısticos, tendencias actuales en Machine Learning. V Congreso Espanol Sobre Metaheurısticas, Algoritmos Evolutivos y Bioinspirados (MAEB’07). Universidad de La Laguna. Puerto de La Cruz (Espana, 2007), 295–302.
Padmanabhan, M., Yuan, P., Chada, G., & Nguyen, H. Van. (2019). Physician-Friendly Machine Learning: A Case Study with Cardiovascular Disease Risk Prediction. Journal of Clinical Medicine, 8(7), 1050. https://doi.org/10.3390/jcm8071050
Patiño-Villada, F. A., Arango-Vélez, E. F., Quintero-Velásquez, M. A., & Arenas-Sosa, M. M. (2011). Cardiovascular risk factors in an urban Colombia population. Revista de Salud Pública, 13(3), 433–445.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., Duchesnay, E., & Louppe, G. (2012). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12.
Plazzotta, F., Luna, D., & González Bernaldo de Quirós, F. (2015). Sistemas de Información en Salud: Integrando datos clínicos en diferentes escenarios y usuarios . In Revista Peruana de Medicina Experimental y Salud Publica (Vol. 32, pp. 343–351). scielo .
Prasad, N. R., Almanza-Garcia, S., & Lu, T. T. (2009). Anomaly detection. Computers, Materials and Continua, 14(1), 1–22. https://doi.org/10.1145/1541880.1541882
R Core Team. (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing. http://www.r-project.org/
Ramírez-Vélez, R., Agredo, R. A., Jerez, A. M., & Chapal, L. Y. (2008). Calidad de vida y condiciones de salud en adultos mayores no institucionalizados en Cali, Colombia. Revista de Salud Pública, 10, 529–536.
Restrepo, L. F., & González, J. (2007). From Pearson to Spearman. Revista Colombiana de Ciencias Pecuarias, 20(2). http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-06902007000200010
Sangra, R. A., & Codina, A. F. (2015). Identificación, impacto y tratamiento de datos perdidos y atípicos en epidemiología nutricional. Rev Esp Nutr Comunitaria, 21(Supl 1), 188–194.
Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/https://doi.org/10.1016/j.ipm.2009.03.002
Suzuki, S., Yamashita, T., Sakama, T., Arita, T., Yagi, N., Otsuka, T., Semba, H., Kano, H., Matsuno, S., Kato, Y., Uejima, T., Oikawa, Y., Matsuhama, M., & Yajima, J. (2019). Comparison of risk models for mortality and cardiovascular events between machine learning and conventional logistic regression analysis. PLOS ONE, 14(9), e0221911. https://doi.org/10.1371/journal.pone.0221911
Tharwat, A. (2020). Classification assessment methods. In Applied Computing and Informatics: Vol. ahead-of-p (Issue ahead-of-print). https://doi.org/10.1016/j.aci.2018.08.003
Touzani, S., Granderson, J., & Fernandes, S. (2018). Gradient boosting machine for modeling the energy consumption of commercial buildings. Energy and Buildings, 158. https://doi.org/10.1016/j.enbuild.2017.11.039
van Rossum, G. (1995). Python tutorial (Issue R 9526). CWI.
Wang, H., Li, Y., Ning, H., Wilkins, J., Lloyd-Jones, D., & Luo, Y. (2019). Using Machine Learning to Integrate Socio-Behavioral Factors in Predicting Cardiovascular-Related Mortality Risk. Studies in Health Technology and Informatics, 264, 433–437. https://doi.org/10.3233/SHTI190258
Ward, A., Sarraju, A., Chung, S., Li, J., Harrington, R., Heidenreich, P., Palaniappan, L., Scheinker, D., & Rodriguez, F. (2020). Machine learning and atherosclerotic cardiovascular disease risk prediction in a multi-ethnic population. Npj Digital Medicine, 3(1), 125. https://doi.org/10.1038/s41746-020-00331-1
Weng, S. F., Reps, J., Kai, J., Garibaldi, J. M., & Qureshi, N. (2017). Can machine-learning improve cardiovascular risk prediction using routine clinical data? PloS One, 12(4), e0174944–e0174944. https://doi.org/10.1371/journal.pone.0174944
Wiens, J., & Shenoy, E. S. (2018). Machine Learning for Healthcare: On the Verge of a Major Shift in Healthcare Epidemiology. Clinical Infectious Diseases, 66(1), 149–153. https://doi.org/10.1093/cid/cix731
Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining, 29–39.
Yu, L., & Liu, H. (2003). Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 80 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia - Sede Medellín
dc.publisher.program.spa.fl_str_mv Medellín - Minas - Maestría en Ingeniería - Analítica
dc.publisher.department.spa.fl_str_mv Departamento de la Computación y la Decisión
dc.publisher.faculty.spa.fl_str_mv Facultad de Minas
dc.publisher.place.spa.fl_str_mv Medellín
dc.publisher.branch.spa.fl_str_mv Universidad Nacional de Colombia - Sede Medellín
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/79641/4/license.txt
https://repositorio.unal.edu.co/bitstream/unal/79641/5/1152700918.2020.pdf
https://repositorio.unal.edu.co/bitstream/unal/79641/6/license_rdf
https://repositorio.unal.edu.co/bitstream/unal/79641/7/1152700918.2020.pdf.jpg
bitstream.checksum.fl_str_mv cccfe52f796b7c63423298c2d3365fc6
09fe739709745fe64c66731e2428eb68
f7d494f61e544413a13e6ba1da2089cd
627ba5dc9d45a4b100486d7beffc67c3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089763252076544
spelling Atribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Villa Garzón, Fernán Alonso9c83ea56495b8f17a79c27fd0001bb81Londoño Ocampo, Manuelac5befdd5d3cfbb2a4ecdae337dcde6612021-06-16T16:54:06Z2021-06-16T16:54:06Z2020https://repositorio.unal.edu.co/handle/unal/79641Universidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; en Colombia la situación es similar. Para la estimación del riesgo cardiovascular se han creado diferentes métodos que analizan el desarrollo de este tipo de enfermedades según el grado de exposición a algunos factores de riesgo, pero estos no suelen ser precisos en todas las poblaciones. El aprendizaje de máquinas ha demostrado su valor de aplicación en contextos médicos, siendo una herramienta novedosa y alternativa que apoya tareas complejas como el diagnóstico de enfermedades. En el presente trabajo se consideran tres modelos de aprendizaje de máquinas, usados en tareas de clasificación que, según la revisión de la literatura desarrollada, pueden ser óptimos en información clínica, con lo que se pretende identificar para una población colombiana de adultos mayores el riesgo asociado al padecimiento de enfermedades cardiovasculares. Para la evaluación del desempeño de los modelos propuestos se utilizan criterios de bondad de ajuste como exactitud, sensibilidad, precisión y f1-score, donde el modelo óptimo se obtiene con el algoritmo de máquina de aumento de gradiente, con un rendimiento mejor a los reportados por estudios similares referenciados.Figures of the World Health Organization (WHO) demonstrated that cardiovascular disease (CVD) is the first cause of death worldwide. The risk of suffering is higher in older people and increases with some preview’s pathologies like hypertension, diabetes, obesity, and smoking. The tendency is equal in Colombia. To estimate cardiovascular risk, different methods have been created that analyze the development of this type of disease according to the degree of exposure to different risk factors, but these are not usually accurate in all populations. Machine learning has proven its application value in medical contexts, being a novel and alternative tool that supports complex tasks such as disease diagnosis. For the present work, three models of machine learning are considered, used in classification tasks that, according to the review of the developed literature may be optimal for clinical information with which it is intended to identify risk for a Colombian population of older adults associated with the suffering of cardiovascular diseases. For the evaluation of the performance of the proposed models, goodness of fit criteria such as accuracy, sensitivity, precision and f1-score are used, where the optimal model is obtained with the gradient boosting machine algorithm, with a better performance than those reported by similar studies referenced.MaestríaMagíster en Ingeniería – Analítica80 páginasapplication/pdfspaUniversidad Nacional de Colombia - Sede MedellínMedellín - Minas - Maestría en Ingeniería - AnalíticaDepartamento de la Computación y la DecisiónFacultad de MinasMedellínUniversidad Nacional de Colombia - Sede Medellín000 - Ciencias de la computación, información y obras generalesEnfermedades cardíacas - DiagnósticoInformática en saludAprendizaje de máquinasRiesgo cardiovascularInformática de la saludMachine Learningcardiovascular riskHealth informaticsDefinición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinasDefinition of a cardiovascular risk classification model for a population of older adults using machine learning techniquesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMLaReferenciaAkoglu, H. (2018). User’s guide to correlation coefficients. Turkish Journal of Emergency Medicine, 18(3), 91–93. https://doi.org/https://doi.org/10.1016/j.tjem.2018.08.001Alaa, A. M., Bolton, T., Di Angelantonio, E., Rudd, J. H. F., & van der Schaar, M. (2019). Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLOS ONE, 14(5), e0213653. https://doi.org/10.1371/journal.pone.0213653Alizadehsani, R., Roshanzamir, M., Hussain, S., Khosravi, A., Koohestani, A., Zangooei, M. H., Abdar, M., Beykikhoshk, A., Shoeibi, A., Zare, A., Panahiazar, M., Nahavandi, S., Srinivasan, D., Atiya, A. F., & Acharya, U. R. (2020). Handling of uncertainty in medical data using machine learning and probability theory techniques: A review of 30 years (1991-2020). http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2008.10114&lang=es&site=eds-liveAlonso, J. C., & Munoz, A. F. (2014). Interpretación de variables Dummy en modelos loglin. Apuntes de Economıa No. 40.Álvarez Ceballos, J. C., Álvarez Múñoz, A., Carvajal Gutiérrez, W., González, M. M., Duque, J. L., & Nieto Cárdenas, O. A. (2017). Determinación del riesgo cardiovascular en una población. Revista Colombiana de Cardiologia, 24(4), 334–341. https://doi.org/10.1016/j.rccar.2016.08.002Álvarez Cosmea, A. (2001). Las tablas de riesgo cardiovascular: Una revisión crítica. MEDIFAM, 11(3), 122–139. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1131-57682001000300002Amón Uribe, I. (2010). Guía metodológica para la selección de técnicas de depuración de datos [Tesis de maestría]. Universidad Nacional de Colombia.Ashfaq, A., & Nowaczyk, S. (2019). Machine learning in healthcare - a system’s perspective. In A. V. B. Aditya Prakash Shweta Bansal, Adam Sadelik (Ed.), Proceedings of the ACM SIGKDD Workshop on Epidemiology meets Data Mining and Knowledge Discovery (epiDAMIK) (pp. 14–17). http://hh.diva-portal.org/smash/get/diva2:1342677/FULLTEXT01.pdfAvila-Chaurand, R., Prado-León, L. R., & González-Muñoz, E. L. (2001). Dimensiones antropométricas de la población latinoamericana: México, Cuba, Colombia, Chile. Centro Universitario de Arte, Arquitectura y Diseño, UDG. 1a Ed. Guadalajara Jalisco.Bandyopadhyay, S., Wolfson, J., Vock, D. M., Vazquez-Benitez, G., Adomavicius, G., Elidrisi, M., Johnson, P. E., & O’Connor, P. J. (2015). Data mining for censored time-to-event data: a Bayesian network model for predicting cardiovascular risk from electronic health record data. Data Mining and Knowledge Discovery, 29(4), 1033–1069. https://doi.org/10.1007/s10618-014-0386-6Basu, T., Engel-Wolf, S., & Menzer, O. (2020). The ethics of machine learning in medical sciences: Where do we stand today? Indian Journal of Dermatology, 65(5), 358–364. http://10.0.16.7/ijd.IJD_419_20Beard, J., Officer, A., Cassels, A., Bustreo, F., Worning, A. M., & Asamoa-Baah, A. (2015). Informe mundial sobre el envejecimiento y la salud. OMS.Bedoya-Mejía, S., Henao-Valencia, C., & Cardona-Arango, D. (2019). Mortalidad por enfermedades del sistema circulatorio, en los municipios del área metropolitana, Antioquia, 1998-2014. Revista Facultad Nacional de Salud Pública, 37(1), 96–105.Bellamy, D., Celi, L., & Beam, A. L. (2020). Evaluating Progress on Machine Learning for Longitudinal Electronic Healthcare Data. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2010.01149&lang=es&site=eds-liveBengio, S., Weston, J., & Grangier, D. (2010). Label Embedding Trees for Large Multi-Class Tasks. In J. Lafferty, C. Williams, J. Shawe-Taylor, R. Zemel, & A. Culotta (Eds.), Advances in Neural Information Processing Systems (Vol. 23, pp. 163–171). Curran Associates, Inc. https://proceedings.neurips.cc/paper/2010/file/06138bc5af6023646ede0e1f7c1eac75-Paper.pdfBerthold, M., Cebron, N., Dill, F., Gabriel, T., Kötter, T., Meinl, T., Ohl, P., Thiel, K., & Wiswedel, B. (2009). KNIME - The Konstanz information miner : Version 2.0 and Beyond. SIGKDD Explorations, 11, 26–31.Bhatti, S., Kehar, V., & Memon, M. A. (2020). Prognosis of Diabetes by Performing Data Mining of HbA1c. International Journal of Computer Science and Information Security (IJCSIS), 18(1).Blagus, R., & Lusa, L. (2013). SMOTE for high-dimensional class-imbalanced data. BMC Bioinformatics, 14, 106. https://doi.org/10.1186/1471-2105-14-106Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32.Cardona Alzate, N. I. (2019). Predicción y selección de variables con bosques aleatorios en presencia de variables correlacionadas [Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/bitstream/handle/unal/75561/8063120.2019.pdf?sequence=1Castellanos Vázquez, J., Moreno, A. S., Herrera, C. B., & Sautto Vallejo, J. M. (2019). Valoración de riesgo cardiovascular mediante modelos de clasificación. Investigación Operacional, 40(1), 80–87. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=133858008&lang=es&site=eds-liveChitarroni, H. (2002). La regresión logística. http://www.salvador.edu.ar/csoc/idicsoLey 1581 de 2012 - Ley Estatutaria de Hábeas Data, (2012). http://bibliotecadigital.ccb.org.co/bitstream/handle/11520/13629/Ley 1581 de 2012.pdf?sequence=1Cosma, G., Acampora, G., Brown, D., Rees, R. C., Khan, M., & Pockley, A. G. (2016). Prediction of Pathological Stage in Patients with Prostate Cancer: A Neuro-Fuzzy Model. PLOS ONE, 11(6), e0155856. https://doi.org/10.1371/journal.pone.0155856Das, R. (2010). A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert Systems with Applications, 37(2), 1568–1572. https://doi.org/10.1016/j.eswa.2009.06.040Díaz-Realpe, J. E., Muñoz-Martínez, J., & Sierra-Torres, C. H. (2007). Factores de riesgo para enfermedad cardiovascular en trabajadores de una institución prestadora de servicios de salud, Colombia. Revista de Salud Pública, 9, 64–75.Estrada, J., Camacho, J. A., Restrepo, M. T., & Parra, C. M. (1998). Parámetros antropométricos de la población laboral colombiana, 1995. Revista Facultad Nacional de Salud Pública, 32, 64–78.Fernando, M., & Arrieta, C. (2005). Estudio sociológico y del conocimiento de los factores de riesgo de las enfermedades cardiovasculares en la Costa Caribe Colombiana (Estudio Caribe). Revista Colombiana de Cardiología, 12, 122–128.Gislason, P. O., Benediktsson, J. A., & Sveinsson, J. R. (2005). Random Forests for land cover classification. Pattern Recognition Letters, 27, 294–300. https://doi.org/10.1016/j.patrec.2005.08.011Gómez, L. A. (2011). Las enfermedades cardiovasculares: un problema de salud pública y un reto global. Biomédica, 31(4).Hameed, N., Shabut, A. M., Ghosh, M. K., & Hossain, M. A. (2020). Multi-class multi-level classification algorithm for skin lesions classification using machine learning techniques. Expert Systems with Applications, 141, 112961. https://doi.org/10.1016/j.eswa.2019.112961Instituto Nacional de Salud de Colombia (INS). (2013). Observatorio Nacional de Salud (ONS) Boletín N0.1. https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/IA/INS/Boletin-tecnico-1-ONS.pdfJamthikar, A., Gupta, D., Khanna, N. N., Saba, L., Laird, J. R., & Suri, J. S. (2020). Cardiovascular/stroke risk prevention: A new machine learning framework integrating carotid ultrasound image-based phenotypes and its harmonics with conventional risk factors. Indian Heart Journal, 72(4), 258–264. https://doi.org/https://doi.org/10.1016/j.ihj.2020.06.004Kalantari, A., Kamsin, A., Shamshirbandb, S., Gani, A., Alinejad Rokny, H., & Chronopoulos, A. T. (2018). Computational intelligence approaches for classification of medical data: State-of-the-art, future challenges and research directions. Neurocomputing, 276.Khan, S. U., Islam, N., Jan, Z., Din, I. U., Khan, A., & Faheem, Y. (2019). An e-Health care services framework for the detection and classification of breast cancer in breast cytology images as an IoMT application. Future Generation Computer Systems, 98, 286–296. https://doi.org/10.1016/j.future.2019.01.033Lemaître, G., Nogueira, F., & Aridas, C. K. (2017). Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. The Journal of Machine Learning Research, 18(1), 559–563.Llibre Guerra, J. C., Guerra Hernández, M. A., & Perera Miniet, E. (2008). Comportamiento de las enfermedades crónicas no transmisibles en adultos mayores. Revista Cubana de Medicina General Integral, 24(4), 0.Lobos Bejarano, J. M., & Brotons Cuixart, C. (2011). Factores de riesgo cardiovascular y atención primaria: evaluación e intervención. Atención Primaria, 43(12), 668–677. https://doi.org/https://doi.org/10.1016/j.aprim.2011.10.002Lopera, M. M. (2017). Revisión comentada de la legislación colombiana en ética de la investigación en salud. Biomedica, 37(4), 1–44. https://doi.org/10.7705/biomedica.v37i4.3333López-Martínez, F., Núñez-Valdez, E. R., García-Díaz, V., & Bursac, Z. (2020). A Case Study for a Big Data and Machine Learning Platform to Improve Medical Decision Support in Population Health Management. Algorithms, 13(4), 102. http://10.0.13.62/a13040102Loreto, M., Lisboa, T., & Moreira, V. P. (2020). Early prediction of ICU readmissions using classification algorithms. Computers in Biology and Medicine, 118, 103636. https://doi.org/10.1016/j.compbiomed.2020.103636Luengo Pérez, L. M., Urbano Gálvez, J. M., & Pérez Miranda, M. (2009). Validación de índices antropométricos alternativos como marcadores del riesgo cardiovascular. Endocrinologia y Nutricion, 56(9), 439–446. https://doi.org/10.1016/S1575-0922(09)72964-XMa, H., Wang, L., & Shen, B. (2011). A new fuzzy support vector machines for class imbalance learning. 2011 International Conference on Electrical and Control Engineering, 3781–3784. https://doi.org/10.1109/ICECENG.2011.6056838Martínez, E. A. B., Ramírez, A. F., & Villamil, E. S. (2016). Modelos predictivos de riesgo cardiovascular. Revista Cuarzo, 22(2), 80–91.Melillo, P., Izzo, R., Orrico, A., Scala, P., Attanasio, M., Mirra, M., De Luca, N., & Pecchia, L. (2015). Automatic Prediction of Cardiovascular and Cerebrovascular Events Using Heart Rate Variability Analysis. PLoS ONE, 10(3), 1–14. http://10.0.5.91/journal.pone.0118504Mierswa, I., Wurst, M., Klinkenberg, R., Scholz, M., & Euler, T. (2006). YALE: Rapid Prototyping for Complex Data Mining Tasks. In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Vol. 2006). https://doi.org/10.1145/1150402.1150531Resolucion 8430 de 1993, (1993). Ministerio de Salud y Protección Social de Colombia. (2013). Envejecimiento demográfico. Colombia 1951-2020 dinámica demográfica y estructuras poblacionales.Moine, J. M. (2013). Metodologías para el descubrimiento de conocimiento en bases de datos: un estudio comparativo.Monroy-de-Jesús, J., Guadalupe-Ramírez, A., Ambriz-Polo, J., & López-González, E. (2018). Algoritmo de aprendizaje eficiente para tratar el problema del desbalance de múltiples clases. Research in Computing Science, 147, 143–157. https://doi.org/10.13053/rcs-147-5-11Muñoz, O. M., García, Á. A., Fernández-Ávila, D., Higuera, A., Ruiz, Á. J., Aschner, P., Toro, J. M., Arteaga, J. M., Merchán, A., Sánchez, G., & Villalba, Y. (2015). Guía de práctica clínica para la prevención, detección temprana, diagnóstico, tratamiento y seguimiento de las dislipidemias: evaluación del riesgo cardiovascular. Revista Colombiana de Cardiología, 22(6), 263–269. https://doi.org/https://doi.org/10.1016/j.rccar.2015.04.009Muñoz, O. M., Rodríguez, N. I., Ruiz, Á., & Rondón, M. (2014). Validación de los modelos de predicción de Framingham y PROCAM como estimadores del riesgo cardiovascular en una población colombiana. Revista Colombiana de Cardiología, 21(4), 202–212. https://doi.org/https://doi.org/10.1016/j.rccar.2014.02.001Muñoz V, O. M., Ruiz Morales, Á. J., Mariño Correa, A., & Bustos C., M. M. (2017). Concordancia entre los modelos de SCORE y Framingham y las ecuaciones AHA/ACC como evaluadores de riesgo cardiovascular. Revista Colombiana de Cardiología, 24(2), 110–116. https://doi.org/https://doi.org/10.1016/j.rccar.2016.06.013Navarro Céspedes, J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para Datos Categóricos. Aplicación en HTA. . Universidad Central “Marta Abreu” de Las Villas.O’Donnell, C. J., & Elosua, R. (2008). Cardiovascular risk factors. Insights from framingham heart study. Revista Espanola de Cardiologia, 61(3), 299–310. https://doi.org/10.1157/13116658OMS. (2008). Prevención de las enfermedades cardiovasculares: guía de bolsillo para la estimación y el manejo del riesgo cardiovascular. Organización Mundial de la Salud.OMS. (2014). Global status report on noncommunicable diseases 2014 (Issue WHO/NMH/NVI/15.1). World Health Organization.Otero, J., & Sánchez, L. (2007). Disenos experimentales y tests estadısticos, tendencias actuales en Machine Learning. V Congreso Espanol Sobre Metaheurısticas, Algoritmos Evolutivos y Bioinspirados (MAEB’07). Universidad de La Laguna. Puerto de La Cruz (Espana, 2007), 295–302.Padmanabhan, M., Yuan, P., Chada, G., & Nguyen, H. Van. (2019). Physician-Friendly Machine Learning: A Case Study with Cardiovascular Disease Risk Prediction. Journal of Clinical Medicine, 8(7), 1050. https://doi.org/10.3390/jcm8071050Patiño-Villada, F. A., Arango-Vélez, E. F., Quintero-Velásquez, M. A., & Arenas-Sosa, M. M. (2011). Cardiovascular risk factors in an urban Colombia population. Revista de Salud Pública, 13(3), 433–445.Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., Duchesnay, E., & Louppe, G. (2012). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12.Plazzotta, F., Luna, D., & González Bernaldo de Quirós, F. (2015). Sistemas de Información en Salud: Integrando datos clínicos en diferentes escenarios y usuarios . In Revista Peruana de Medicina Experimental y Salud Publica (Vol. 32, pp. 343–351). scielo .Prasad, N. R., Almanza-Garcia, S., & Lu, T. T. (2009). Anomaly detection. Computers, Materials and Continua, 14(1), 1–22. https://doi.org/10.1145/1541880.1541882R Core Team. (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing. http://www.r-project.org/Ramírez-Vélez, R., Agredo, R. A., Jerez, A. M., & Chapal, L. Y. (2008). Calidad de vida y condiciones de salud en adultos mayores no institucionalizados en Cali, Colombia. Revista de Salud Pública, 10, 529–536.Restrepo, L. F., & González, J. (2007). From Pearson to Spearman. Revista Colombiana de Ciencias Pecuarias, 20(2). http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-06902007000200010Sangra, R. A., & Codina, A. F. (2015). Identificación, impacto y tratamiento de datos perdidos y atípicos en epidemiología nutricional. Rev Esp Nutr Comunitaria, 21(Supl 1), 188–194.Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/https://doi.org/10.1016/j.ipm.2009.03.002Suzuki, S., Yamashita, T., Sakama, T., Arita, T., Yagi, N., Otsuka, T., Semba, H., Kano, H., Matsuno, S., Kato, Y., Uejima, T., Oikawa, Y., Matsuhama, M., & Yajima, J. (2019). Comparison of risk models for mortality and cardiovascular events between machine learning and conventional logistic regression analysis. PLOS ONE, 14(9), e0221911. https://doi.org/10.1371/journal.pone.0221911Tharwat, A. (2020). Classification assessment methods. In Applied Computing and Informatics: Vol. ahead-of-p (Issue ahead-of-print). https://doi.org/10.1016/j.aci.2018.08.003Touzani, S., Granderson, J., & Fernandes, S. (2018). Gradient boosting machine for modeling the energy consumption of commercial buildings. Energy and Buildings, 158. https://doi.org/10.1016/j.enbuild.2017.11.039van Rossum, G. (1995). Python tutorial (Issue R 9526). CWI.Wang, H., Li, Y., Ning, H., Wilkins, J., Lloyd-Jones, D., & Luo, Y. (2019). Using Machine Learning to Integrate Socio-Behavioral Factors in Predicting Cardiovascular-Related Mortality Risk. Studies in Health Technology and Informatics, 264, 433–437. https://doi.org/10.3233/SHTI190258Ward, A., Sarraju, A., Chung, S., Li, J., Harrington, R., Heidenreich, P., Palaniappan, L., Scheinker, D., & Rodriguez, F. (2020). Machine learning and atherosclerotic cardiovascular disease risk prediction in a multi-ethnic population. Npj Digital Medicine, 3(1), 125. https://doi.org/10.1038/s41746-020-00331-1Weng, S. F., Reps, J., Kai, J., Garibaldi, J. M., & Qureshi, N. (2017). Can machine-learning improve cardiovascular risk prediction using routine clinical data? PloS One, 12(4), e0174944–e0174944. https://doi.org/10.1371/journal.pone.0174944Wiens, J., & Shenoy, E. S. (2018). Machine Learning for Healthcare: On the Verge of a Major Shift in Healthcare Epidemiology. Clinical Infectious Diseases, 66(1), 149–153. https://doi.org/10.1093/cid/cix731Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining, 29–39.Yu, L., & Liu, H. (2003). Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution.LICENSElicense.txtlicense.txttext/plain; charset=utf-83964https://repositorio.unal.edu.co/bitstream/unal/79641/4/license.txtcccfe52f796b7c63423298c2d3365fc6MD54ORIGINAL1152700918.2020.pdf1152700918.2020.pdfTesis Maestría en Ingeniería - Analíticaapplication/pdf2367950https://repositorio.unal.edu.co/bitstream/unal/79641/5/1152700918.2020.pdf09fe739709745fe64c66731e2428eb68MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8799https://repositorio.unal.edu.co/bitstream/unal/79641/6/license_rdff7d494f61e544413a13e6ba1da2089cdMD56THUMBNAIL1152700918.2020.pdf.jpg1152700918.2020.pdf.jpgGenerated Thumbnailimage/jpeg5217https://repositorio.unal.edu.co/bitstream/unal/79641/7/1152700918.2020.pdf.jpg627ba5dc9d45a4b100486d7beffc67c3MD57unal/79641oai:repositorio.unal.edu.co:unal/796412024-07-19 23:32:38.855Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.coUExBTlRJTExBIERFUMOTU0lUTwoKQ29tbyBlZGl0b3IgZGUgZXN0ZSDDrXRlbSwgdXN0ZWQgcHVlZGUgbW92ZXJsbyBhIHJldmlzacOzbiBzaW4gYW50ZXMgcmVzb2x2ZXIgbG9zIHByb2JsZW1hcyBpZGVudGlmaWNhZG9zLCBkZSBsbyBjb250cmFyaW8sIGhhZ2EgY2xpYyBlbiBHdWFyZGFyIHBhcmEgZ3VhcmRhciBlbCDDrXRlbSB5IHNvbHVjaW9uYXIgZXN0b3MgcHJvYmxlbWFzIG1hcyB0YXJkZS4KCk5PVEFTOgoqU0kgTEEgVEVTSVMgQSBQVUJMSUNBUiBBRFFVSVJJw5MgQ09NUFJPTUlTT1MgREUgQ09ORklERU5DSUFMSURBRCBFTiBFTCBERVNBUlJPTExPIE8gUEFSVEVTIERFTCBET0NVTUVOVE8uIFNJR0EgTEEgRElSRUNUUklaIERFIExBIFJFU09MVUNJw5NOIDAyMyBERSAyMDE1LCBQT1IgTEEgQ1VBTCBTRSBFU1RBQkxFQ0UgRUwgUFJPQ0VESU1JRU5UTyBQQVJBIExBIFBVQkxJQ0FDScOTTiBERSBURVNJUyBERSBNQUVTVFLDjUEgWSBET0NUT1JBRE8gREUgTE9TIEVTVFVESUFOVEVTIERFIExBIFVOSVZFUlNJREFEIE5BQ0lPTkFMIERFIENPTE9NQklBIEVOIEVMIFJFUE9TSVRPUklPIElOU1RJVFVDSU9OQUwgVU4sIEVYUEVESURBIFBPUiBMQSBTRUNSRVRBUsONQSBHRU5FUkFMLgoqTEEgVEVTSVMgQSBQVUJMSUNBUiBERUJFIFNFUiBMQSBWRVJTScOTTiBGSU5BTCBBUFJPQkFEQS4KUGFyYSB0cmFiYWpvcyBkZXBvc2l0YWRvcyBwb3Igc3UgcHJvcGlvIGF1dG9yOiBBbCBhdXRvYXJjaGl2YXIgZXN0ZSBncnVwbyBkZSBhcmNoaXZvcyBkaWdpdGFsZXMgeSBzdXMgbWV0YWRhdG9zLCBZbyBnYXJhbnRpem8gYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBVTiBlbCBkZXJlY2hvIGEgYWxtYWNlbmFybG9zIHkgbWFudGVuZXJsb3MgZGlzcG9uaWJsZXMgZW4gbMOtbmVhIGRlIG1hbmVyYSBncmF0dWl0YS4gRGVjbGFybyBxdWUgZGljaG8gbWF0ZXJpYWwgZXMgZGUgbWkgcHJvcGllZGFkIGludGVsZWN0dWFsIHkgcXVlIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwgVU4gbm8gYXN1bWUgbmluZ3VuYSByZXNwb25zYWJpbGlkYWQgc2kgaGF5IGFsZ3VuYSB2aW9sYWNpw7NuIGEgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGFsIGRpc3RyaWJ1aXIgZXN0b3MgYXJjaGl2b3MgeSBtZXRhZGF0b3MuIChTZSByZWNvbWllbmRhIGEgdG9kb3MgbG9zIGF1dG9yZXMgYSBpbmRpY2FyIHN1cyBkZXJlY2hvcyBkZSBhdXRvciBlbiBsYSBww6FnaW5hIGRlIHTDrXR1bG8gZGUgc3UgZG9jdW1lbnRvLikgRGUgbGEgbWlzbWEgbWFuZXJhLCBhY2VwdG8gbG9zIHTDqXJtaW5vcyBkZSBsYSBzaWd1aWVudGUgbGljZW5jaWE6IExvcyBhdXRvcmVzIG8gdGl0dWxhcmVzIGRlbCBkZXJlY2hvIGRlIGF1dG9yIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8gY29uZmllcmVuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSwgbGltaXRhZGEgeSBncmF0dWl0YSBzb2JyZSBsYSBvYnJhIHF1ZSBzZSBpbnRlZ3JhIGVuIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwsIHF1ZSBzZSBhanVzdGEgYSBsYXMgc2lndWllbnRlcyBjYXJhY3RlcsOtc3RpY2FzOiBhKSBFc3RhcsOhIHZpZ2VudGUgYSBwYXJ0aXIgZGUgbGEgZmVjaGEgZW4gcXVlIHNlIGluY2x1eWUgZW4gZWwgcmVwb3NpdG9yaW8sIHF1ZSBzZXLDoW4gcHJvcnJvZ2FibGVzIGluZGVmaW5pZGFtZW50ZSBwb3IgZWwgdGllbXBvIHF1ZSBkdXJlIGVsIGRlcmVjaG8gcGF0cmltb25pYWwgZGVsIGF1dG9yLiBFbCBhdXRvciBwb2Ryw6EgZGFyIHBvciB0ZXJtaW5hZGEgbGEgbGljZW5jaWEgc29saWNpdMOhbmRvbG8gYSBsYSBVbml2ZXJzaWRhZC4gYikgTG9zIGF1dG9yZXMgYXV0b3JpemFuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgcGFyYSBwdWJsaWNhciBsYSBvYnJhIGVuIGVsIGZvcm1hdG8gcXVlIGVsIHJlcG9zaXRvcmlvIGxvIHJlcXVpZXJhIChpbXByZXNvLCBkaWdpdGFsLCBlbGVjdHLDs25pY28gbyBjdWFscXVpZXIgb3RybyBjb25vY2lkbyBvIHBvciBjb25vY2VyKSB5IGNvbm9jZW4gcXVlIGRhZG8gcXVlIHNlIHB1YmxpY2EgZW4gSW50ZXJuZXQgcG9yIGVzdGUgaGVjaG8gY2lyY3VsYSBjb24gdW4gYWxjYW5jZSBtdW5kaWFsLiBjKSBMb3MgYXV0b3JlcyBhY2VwdGFuIHF1ZSBsYSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgYSB0w610dWxvIGdyYXR1aXRvLCBwb3IgbG8gdGFudG8sIHJlbnVuY2lhbiBhIHJlY2liaXIgZW1vbHVtZW50byBhbGd1bm8gcG9yIGxhIHB1YmxpY2FjacOzbiwgZGlzdHJpYnVjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSB5IGN1YWxxdWllciBvdHJvIHVzbyBxdWUgc2UgaGFnYSBlbiBsb3MgdMOpcm1pbm9zIGRlIGxhIHByZXNlbnRlIGxpY2VuY2lhIHkgZGUgbGEgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBjb24gcXVlIHNlIHB1YmxpY2EuIGQpIExvcyBhdXRvcmVzIG1hbmlmaWVzdGFuIHF1ZSBzZSB0cmF0YSBkZSB1bmEgb2JyYSBvcmlnaW5hbCBzb2JyZSBsYSBxdWUgdGllbmVuIGxvcyBkZXJlY2hvcyBxdWUgYXV0b3JpemFuIHkgcXVlIHNvbiBlbGxvcyBxdWllbmVzIGFzdW1lbiB0b3RhbCByZXNwb25zYWJpbGlkYWQgcG9yIGVsIGNvbnRlbmlkbyBkZSBzdSBvYnJhIGFudGUgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgeSBhbnRlIHRlcmNlcm9zLiBFbiB0b2RvIGNhc28gbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgc2UgY29tcHJvbWV0ZSBhIGluZGljYXIgc2llbXByZSBsYSBhdXRvcsOtYSBpbmNsdXllbmRvIGVsIG5vbWJyZSBkZWwgYXV0b3IgeSBsYSBmZWNoYSBkZSBwdWJsaWNhY2nDs24uIGUpIExvcyBhdXRvcmVzIGF1dG9yaXphbiBhIGxhIFVuaXZlcnNpZGFkIHBhcmEgaW5jbHVpciBsYSBvYnJhIGVuIGxvcyDDrW5kaWNlcyB5IGJ1c2NhZG9yZXMgcXVlIGVzdGltZW4gbmVjZXNhcmlvcyBwYXJhIHByb21vdmVyIHN1IGRpZnVzacOzbi4gZikgTG9zIGF1dG9yZXMgYWNlcHRhbiBxdWUgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgcHVlZGEgY29udmVydGlyIGVsIGRvY3VtZW50byBhIGN1YWxxdWllciBtZWRpbyBvIGZvcm1hdG8gcGFyYSBwcm9ww7NzaXRvcyBkZSBwcmVzZXJ2YWNpw7NuIGRpZ2l0YWwuIFNJIEVMIERPQ1VNRU5UTyBTRSBCQVNBIEVOIFVOIFRSQUJBSk8gUVVFIEhBIFNJRE8gUEFUUk9DSU5BRE8gTyBBUE9ZQURPIFBPUiBVTkEgQUdFTkNJQSBPIFVOQSBPUkdBTklaQUNJw5NOLCBDT04gRVhDRVBDScOTTiBERSBMQSBVTklWRVJTSURBRCBOQUNJT05BTCBERSBDT0xPTUJJQSwgTE9TIEFVVE9SRVMgR0FSQU5USVpBTiBRVUUgU0UgSEEgQ1VNUExJRE8gQ09OIExPUyBERVJFQ0hPUyBZIE9CTElHQUNJT05FUyBSRVFVRVJJRE9TIFBPUiBFTCBSRVNQRUNUSVZPIENPTlRSQVRPIE8gQUNVRVJETy4KUGFyYSB0cmFiYWpvcyBkZXBvc2l0YWRvcyBwb3Igb3RyYXMgcGVyc29uYXMgZGlzdGludGFzIGEgc3UgYXV0b3I6IERlY2xhcm8gcXVlIGVsIGdydXBvIGRlIGFyY2hpdm9zIGRpZ2l0YWxlcyB5IG1ldGFkYXRvcyBhc29jaWFkb3MgcXVlIGVzdG95IGFyY2hpdmFuZG8gZW4gZWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBVTikgZXMgZGUgZG9taW5pbyBww7pibGljby4gU2kgbm8gZnVlc2UgZWwgY2FzbywgYWNlcHRvIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkIHBvciBjdWFscXVpZXIgaW5mcmFjY2nDs24gZGUgZGVyZWNob3MgZGUgYXV0b3IgcXVlIGNvbmxsZXZlIGxhIGRpc3RyaWJ1Y2nDs24gZGUgZXN0b3MgYXJjaGl2b3MgeSBtZXRhZGF0b3MuCkFsIGhhY2VyIGNsaWMgZW4gZWwgc2lndWllbnRlIGJvdMOzbiwgdXN0ZWQgaW5kaWNhIHF1ZSBlc3TDoSBkZSBhY3VlcmRvIGNvbiBlc3RvcyB0w6lybWlub3MuCgpVTklWRVJTSURBRCBOQUNJT05BTCBERSBDT0xPTUJJQSAtIMOabHRpbWEgbW9kaWZpY2FjacOzbiAyNy8yMC8yMDIwCg==