Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; e...
- Autores:
-
Londoño Ocampo, Manuela
- Tipo de recurso:
- Fecha de publicación:
- 2020
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/79641
- Palabra clave:
- 000 - Ciencias de la computación, información y obras generales
Enfermedades cardíacas - Diagnóstico
Informática en salud
Aprendizaje de máquinas
Riesgo cardiovascular
Informática de la salud
Machine Learning
cardiovascular risk
Health informatics
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
id |
UNACIONAL2_dce8679c3b92326277bb57a71fe849ef |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/79641 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
dc.title.translated.eng.fl_str_mv |
Definition of a cardiovascular risk classification model for a population of older adults using machine learning techniques |
title |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
spellingShingle |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas 000 - Ciencias de la computación, información y obras generales Enfermedades cardíacas - Diagnóstico Informática en salud Aprendizaje de máquinas Riesgo cardiovascular Informática de la salud Machine Learning cardiovascular risk Health informatics |
title_short |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
title_full |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
title_fullStr |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
title_full_unstemmed |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
title_sort |
Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas |
dc.creator.fl_str_mv |
Londoño Ocampo, Manuela |
dc.contributor.advisor.none.fl_str_mv |
Villa Garzón, Fernán Alonso |
dc.contributor.author.none.fl_str_mv |
Londoño Ocampo, Manuela |
dc.subject.ddc.spa.fl_str_mv |
000 - Ciencias de la computación, información y obras generales |
topic |
000 - Ciencias de la computación, información y obras generales Enfermedades cardíacas - Diagnóstico Informática en salud Aprendizaje de máquinas Riesgo cardiovascular Informática de la salud Machine Learning cardiovascular risk Health informatics |
dc.subject.lemb.none.fl_str_mv |
Enfermedades cardíacas - Diagnóstico Informática en salud |
dc.subject.proposal.spa.fl_str_mv |
Aprendizaje de máquinas Riesgo cardiovascular Informática de la salud |
dc.subject.proposal.eng.fl_str_mv |
Machine Learning cardiovascular risk Health informatics |
description |
Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; en Colombia la situación es similar. Para la estimación del riesgo cardiovascular se han creado diferentes métodos que analizan el desarrollo de este tipo de enfermedades según el grado de exposición a algunos factores de riesgo, pero estos no suelen ser precisos en todas las poblaciones. El aprendizaje de máquinas ha demostrado su valor de aplicación en contextos médicos, siendo una herramienta novedosa y alternativa que apoya tareas complejas como el diagnóstico de enfermedades. En el presente trabajo se consideran tres modelos de aprendizaje de máquinas, usados en tareas de clasificación que, según la revisión de la literatura desarrollada, pueden ser óptimos en información clínica, con lo que se pretende identificar para una población colombiana de adultos mayores el riesgo asociado al padecimiento de enfermedades cardiovasculares. Para la evaluación del desempeño de los modelos propuestos se utilizan criterios de bondad de ajuste como exactitud, sensibilidad, precisión y f1-score, donde el modelo óptimo se obtiene con el algoritmo de máquina de aumento de gradiente, con un rendimiento mejor a los reportados por estudios similares referenciados. |
publishDate |
2020 |
dc.date.issued.none.fl_str_mv |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-06-16T16:54:06Z |
dc.date.available.none.fl_str_mv |
2021-06-16T16:54:06Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/79641 |
dc.identifier.instname.spa.fl_str_mv |
Universidad Nacional de Colombia |
dc.identifier.reponame.spa.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
dc.identifier.repourl.spa.fl_str_mv |
https://repositorio.unal.edu.co/ |
url |
https://repositorio.unal.edu.co/handle/unal/79641 https://repositorio.unal.edu.co/ |
identifier_str_mv |
Universidad Nacional de Colombia Repositorio Institucional Universidad Nacional de Colombia |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.indexed.spa.fl_str_mv |
LaReferencia |
dc.relation.references.spa.fl_str_mv |
Akoglu, H. (2018). User’s guide to correlation coefficients. Turkish Journal of Emergency Medicine, 18(3), 91–93. https://doi.org/https://doi.org/10.1016/j.tjem.2018.08.001 Alaa, A. M., Bolton, T., Di Angelantonio, E., Rudd, J. H. F., & van der Schaar, M. (2019). Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLOS ONE, 14(5), e0213653. https://doi.org/10.1371/journal.pone.0213653 Alizadehsani, R., Roshanzamir, M., Hussain, S., Khosravi, A., Koohestani, A., Zangooei, M. H., Abdar, M., Beykikhoshk, A., Shoeibi, A., Zare, A., Panahiazar, M., Nahavandi, S., Srinivasan, D., Atiya, A. F., & Acharya, U. R. (2020). Handling of uncertainty in medical data using machine learning and probability theory techniques: A review of 30 years (1991-2020). http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2008.10114&lang=es&site=eds-live Alonso, J. C., & Munoz, A. F. (2014). Interpretación de variables Dummy en modelos loglin. Apuntes de Economıa No. 40. Álvarez Ceballos, J. C., Álvarez Múñoz, A., Carvajal Gutiérrez, W., González, M. M., Duque, J. L., & Nieto Cárdenas, O. A. (2017). Determinación del riesgo cardiovascular en una población. Revista Colombiana de Cardiologia, 24(4), 334–341. https://doi.org/10.1016/j.rccar.2016.08.002 Álvarez Cosmea, A. (2001). Las tablas de riesgo cardiovascular: Una revisión crítica. MEDIFAM, 11(3), 122–139. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1131-57682001000300002 Amón Uribe, I. (2010). Guía metodológica para la selección de técnicas de depuración de datos [Tesis de maestría]. Universidad Nacional de Colombia. Ashfaq, A., & Nowaczyk, S. (2019). Machine learning in healthcare - a system’s perspective. In A. V. B. Aditya Prakash Shweta Bansal, Adam Sadelik (Ed.), Proceedings of the ACM SIGKDD Workshop on Epidemiology meets Data Mining and Knowledge Discovery (epiDAMIK) (pp. 14–17). http://hh.diva-portal.org/smash/get/diva2:1342677/FULLTEXT01.pdf Avila-Chaurand, R., Prado-León, L. R., & González-Muñoz, E. L. (2001). Dimensiones antropométricas de la población latinoamericana: México, Cuba, Colombia, Chile. Centro Universitario de Arte, Arquitectura y Diseño, UDG. 1a Ed. Guadalajara Jalisco. Bandyopadhyay, S., Wolfson, J., Vock, D. M., Vazquez-Benitez, G., Adomavicius, G., Elidrisi, M., Johnson, P. E., & O’Connor, P. J. (2015). Data mining for censored time-to-event data: a Bayesian network model for predicting cardiovascular risk from electronic health record data. Data Mining and Knowledge Discovery, 29(4), 1033–1069. https://doi.org/10.1007/s10618-014-0386-6 Basu, T., Engel-Wolf, S., & Menzer, O. (2020). The ethics of machine learning in medical sciences: Where do we stand today? Indian Journal of Dermatology, 65(5), 358–364. http://10.0.16.7/ijd.IJD_419_20 Beard, J., Officer, A., Cassels, A., Bustreo, F., Worning, A. M., & Asamoa-Baah, A. (2015). Informe mundial sobre el envejecimiento y la salud. OMS. Bedoya-Mejía, S., Henao-Valencia, C., & Cardona-Arango, D. (2019). Mortalidad por enfermedades del sistema circulatorio, en los municipios del área metropolitana, Antioquia, 1998-2014. Revista Facultad Nacional de Salud Pública, 37(1), 96–105. Bellamy, D., Celi, L., & Beam, A. L. (2020). Evaluating Progress on Machine Learning for Longitudinal Electronic Healthcare Data. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2010.01149&lang=es&site=eds-live Bengio, S., Weston, J., & Grangier, D. (2010). Label Embedding Trees for Large Multi-Class Tasks. In J. Lafferty, C. Williams, J. Shawe-Taylor, R. Zemel, & A. Culotta (Eds.), Advances in Neural Information Processing Systems (Vol. 23, pp. 163–171). Curran Associates, Inc. https://proceedings.neurips.cc/paper/2010/file/06138bc5af6023646ede0e1f7c1eac75-Paper.pdf Berthold, M., Cebron, N., Dill, F., Gabriel, T., Kötter, T., Meinl, T., Ohl, P., Thiel, K., & Wiswedel, B. (2009). KNIME - The Konstanz information miner : Version 2.0 and Beyond. SIGKDD Explorations, 11, 26–31. Bhatti, S., Kehar, V., & Memon, M. A. (2020). Prognosis of Diabetes by Performing Data Mining of HbA1c. International Journal of Computer Science and Information Security (IJCSIS), 18(1). Blagus, R., & Lusa, L. (2013). SMOTE for high-dimensional class-imbalanced data. BMC Bioinformatics, 14, 106. https://doi.org/10.1186/1471-2105-14-106 Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. Cardona Alzate, N. I. (2019). Predicción y selección de variables con bosques aleatorios en presencia de variables correlacionadas [Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/bitstream/handle/unal/75561/8063120.2019.pdf?sequence=1 Castellanos Vázquez, J., Moreno, A. S., Herrera, C. B., & Sautto Vallejo, J. M. (2019). Valoración de riesgo cardiovascular mediante modelos de clasificación. Investigación Operacional, 40(1), 80–87. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=133858008&lang=es&site=eds-live Chitarroni, H. (2002). La regresión logística. http://www.salvador.edu.ar/csoc/idicso Ley 1581 de 2012 - Ley Estatutaria de Hábeas Data, (2012). http://bibliotecadigital.ccb.org.co/bitstream/handle/11520/13629/Ley 1581 de 2012.pdf?sequence=1 Cosma, G., Acampora, G., Brown, D., Rees, R. C., Khan, M., & Pockley, A. G. (2016). Prediction of Pathological Stage in Patients with Prostate Cancer: A Neuro-Fuzzy Model. PLOS ONE, 11(6), e0155856. https://doi.org/10.1371/journal.pone.0155856 Das, R. (2010). A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert Systems with Applications, 37(2), 1568–1572. https://doi.org/10.1016/j.eswa.2009.06.040 Díaz-Realpe, J. E., Muñoz-Martínez, J., & Sierra-Torres, C. H. (2007). Factores de riesgo para enfermedad cardiovascular en trabajadores de una institución prestadora de servicios de salud, Colombia. Revista de Salud Pública, 9, 64–75. Estrada, J., Camacho, J. A., Restrepo, M. T., & Parra, C. M. (1998). Parámetros antropométricos de la población laboral colombiana, 1995. Revista Facultad Nacional de Salud Pública, 32, 64–78. Fernando, M., & Arrieta, C. (2005). Estudio sociológico y del conocimiento de los factores de riesgo de las enfermedades cardiovasculares en la Costa Caribe Colombiana (Estudio Caribe). Revista Colombiana de Cardiología, 12, 122–128. Gislason, P. O., Benediktsson, J. A., & Sveinsson, J. R. (2005). Random Forests for land cover classification. Pattern Recognition Letters, 27, 294–300. https://doi.org/10.1016/j.patrec.2005.08.011 Gómez, L. A. (2011). Las enfermedades cardiovasculares: un problema de salud pública y un reto global. Biomédica, 31(4). Hameed, N., Shabut, A. M., Ghosh, M. K., & Hossain, M. A. (2020). Multi-class multi-level classification algorithm for skin lesions classification using machine learning techniques. Expert Systems with Applications, 141, 112961. https://doi.org/10.1016/j.eswa.2019.112961 Instituto Nacional de Salud de Colombia (INS). (2013). Observatorio Nacional de Salud (ONS) Boletín N0.1. https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/IA/INS/Boletin-tecnico-1-ONS.pdf Jamthikar, A., Gupta, D., Khanna, N. N., Saba, L., Laird, J. R., & Suri, J. S. (2020). Cardiovascular/stroke risk prevention: A new machine learning framework integrating carotid ultrasound image-based phenotypes and its harmonics with conventional risk factors. Indian Heart Journal, 72(4), 258–264. https://doi.org/https://doi.org/10.1016/j.ihj.2020.06.004 Kalantari, A., Kamsin, A., Shamshirbandb, S., Gani, A., Alinejad Rokny, H., & Chronopoulos, A. T. (2018). Computational intelligence approaches for classification of medical data: State-of-the-art, future challenges and research directions. Neurocomputing, 276. Khan, S. U., Islam, N., Jan, Z., Din, I. U., Khan, A., & Faheem, Y. (2019). An e-Health care services framework for the detection and classification of breast cancer in breast cytology images as an IoMT application. Future Generation Computer Systems, 98, 286–296. https://doi.org/10.1016/j.future.2019.01.033 Lemaître, G., Nogueira, F., & Aridas, C. K. (2017). Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. The Journal of Machine Learning Research, 18(1), 559–563. Llibre Guerra, J. C., Guerra Hernández, M. A., & Perera Miniet, E. (2008). Comportamiento de las enfermedades crónicas no transmisibles en adultos mayores. Revista Cubana de Medicina General Integral, 24(4), 0. Lobos Bejarano, J. M., & Brotons Cuixart, C. (2011). Factores de riesgo cardiovascular y atención primaria: evaluación e intervención. Atención Primaria, 43(12), 668–677. https://doi.org/https://doi.org/10.1016/j.aprim.2011.10.002 Lopera, M. M. (2017). Revisión comentada de la legislación colombiana en ética de la investigación en salud. Biomedica, 37(4), 1–44. https://doi.org/10.7705/biomedica.v37i4.3333 López-Martínez, F., Núñez-Valdez, E. R., García-Díaz, V., & Bursac, Z. (2020). A Case Study for a Big Data and Machine Learning Platform to Improve Medical Decision Support in Population Health Management. Algorithms, 13(4), 102. http://10.0.13.62/a13040102 Loreto, M., Lisboa, T., & Moreira, V. P. (2020). Early prediction of ICU readmissions using classification algorithms. Computers in Biology and Medicine, 118, 103636. https://doi.org/10.1016/j.compbiomed.2020.103636 Luengo Pérez, L. M., Urbano Gálvez, J. M., & Pérez Miranda, M. (2009). Validación de índices antropométricos alternativos como marcadores del riesgo cardiovascular. Endocrinologia y Nutricion, 56(9), 439–446. https://doi.org/10.1016/S1575-0922(09)72964-X Ma, H., Wang, L., & Shen, B. (2011). A new fuzzy support vector machines for class imbalance learning. 2011 International Conference on Electrical and Control Engineering, 3781–3784. https://doi.org/10.1109/ICECENG.2011.6056838 Martínez, E. A. B., Ramírez, A. F., & Villamil, E. S. (2016). Modelos predictivos de riesgo cardiovascular. Revista Cuarzo, 22(2), 80–91. Melillo, P., Izzo, R., Orrico, A., Scala, P., Attanasio, M., Mirra, M., De Luca, N., & Pecchia, L. (2015). Automatic Prediction of Cardiovascular and Cerebrovascular Events Using Heart Rate Variability Analysis. PLoS ONE, 10(3), 1–14. http://10.0.5.91/journal.pone.0118504 Mierswa, I., Wurst, M., Klinkenberg, R., Scholz, M., & Euler, T. (2006). YALE: Rapid Prototyping for Complex Data Mining Tasks. In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Vol. 2006). https://doi.org/10.1145/1150402.1150531 Resolucion 8430 de 1993, (1993). Ministerio de Salud y Protección Social de Colombia. (2013). Envejecimiento demográfico. Colombia 1951-2020 dinámica demográfica y estructuras poblacionales. Moine, J. M. (2013). Metodologías para el descubrimiento de conocimiento en bases de datos: un estudio comparativo. Monroy-de-Jesús, J., Guadalupe-Ramírez, A., Ambriz-Polo, J., & López-González, E. (2018). Algoritmo de aprendizaje eficiente para tratar el problema del desbalance de múltiples clases. Research in Computing Science, 147, 143–157. https://doi.org/10.13053/rcs-147-5-11 Muñoz, O. M., García, Á. A., Fernández-Ávila, D., Higuera, A., Ruiz, Á. J., Aschner, P., Toro, J. M., Arteaga, J. M., Merchán, A., Sánchez, G., & Villalba, Y. (2015). Guía de práctica clínica para la prevención, detección temprana, diagnóstico, tratamiento y seguimiento de las dislipidemias: evaluación del riesgo cardiovascular. Revista Colombiana de Cardiología, 22(6), 263–269. https://doi.org/https://doi.org/10.1016/j.rccar.2015.04.009 Muñoz, O. M., Rodríguez, N. I., Ruiz, Á., & Rondón, M. (2014). Validación de los modelos de predicción de Framingham y PROCAM como estimadores del riesgo cardiovascular en una población colombiana. Revista Colombiana de Cardiología, 21(4), 202–212. https://doi.org/https://doi.org/10.1016/j.rccar.2014.02.001 Muñoz V, O. M., Ruiz Morales, Á. J., Mariño Correa, A., & Bustos C., M. M. (2017). Concordancia entre los modelos de SCORE y Framingham y las ecuaciones AHA/ACC como evaluadores de riesgo cardiovascular. Revista Colombiana de Cardiología, 24(2), 110–116. https://doi.org/https://doi.org/10.1016/j.rccar.2016.06.013 Navarro Céspedes, J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para Datos Categóricos. Aplicación en HTA. . Universidad Central “Marta Abreu” de Las Villas. O’Donnell, C. J., & Elosua, R. (2008). Cardiovascular risk factors. Insights from framingham heart study. Revista Espanola de Cardiologia, 61(3), 299–310. https://doi.org/10.1157/13116658 OMS. (2008). Prevención de las enfermedades cardiovasculares: guía de bolsillo para la estimación y el manejo del riesgo cardiovascular. Organización Mundial de la Salud. OMS. (2014). Global status report on noncommunicable diseases 2014 (Issue WHO/NMH/NVI/15.1). World Health Organization. Otero, J., & Sánchez, L. (2007). Disenos experimentales y tests estadısticos, tendencias actuales en Machine Learning. V Congreso Espanol Sobre Metaheurısticas, Algoritmos Evolutivos y Bioinspirados (MAEB’07). Universidad de La Laguna. Puerto de La Cruz (Espana, 2007), 295–302. Padmanabhan, M., Yuan, P., Chada, G., & Nguyen, H. Van. (2019). Physician-Friendly Machine Learning: A Case Study with Cardiovascular Disease Risk Prediction. Journal of Clinical Medicine, 8(7), 1050. https://doi.org/10.3390/jcm8071050 Patiño-Villada, F. A., Arango-Vélez, E. F., Quintero-Velásquez, M. A., & Arenas-Sosa, M. M. (2011). Cardiovascular risk factors in an urban Colombia population. Revista de Salud Pública, 13(3), 433–445. Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., Duchesnay, E., & Louppe, G. (2012). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12. Plazzotta, F., Luna, D., & González Bernaldo de Quirós, F. (2015). Sistemas de Información en Salud: Integrando datos clínicos en diferentes escenarios y usuarios . In Revista Peruana de Medicina Experimental y Salud Publica (Vol. 32, pp. 343–351). scielo . Prasad, N. R., Almanza-Garcia, S., & Lu, T. T. (2009). Anomaly detection. Computers, Materials and Continua, 14(1), 1–22. https://doi.org/10.1145/1541880.1541882 R Core Team. (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing. http://www.r-project.org/ Ramírez-Vélez, R., Agredo, R. A., Jerez, A. M., & Chapal, L. Y. (2008). Calidad de vida y condiciones de salud en adultos mayores no institucionalizados en Cali, Colombia. Revista de Salud Pública, 10, 529–536. Restrepo, L. F., & González, J. (2007). From Pearson to Spearman. Revista Colombiana de Ciencias Pecuarias, 20(2). http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-06902007000200010 Sangra, R. A., & Codina, A. F. (2015). Identificación, impacto y tratamiento de datos perdidos y atípicos en epidemiología nutricional. Rev Esp Nutr Comunitaria, 21(Supl 1), 188–194. Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/https://doi.org/10.1016/j.ipm.2009.03.002 Suzuki, S., Yamashita, T., Sakama, T., Arita, T., Yagi, N., Otsuka, T., Semba, H., Kano, H., Matsuno, S., Kato, Y., Uejima, T., Oikawa, Y., Matsuhama, M., & Yajima, J. (2019). Comparison of risk models for mortality and cardiovascular events between machine learning and conventional logistic regression analysis. PLOS ONE, 14(9), e0221911. https://doi.org/10.1371/journal.pone.0221911 Tharwat, A. (2020). Classification assessment methods. In Applied Computing and Informatics: Vol. ahead-of-p (Issue ahead-of-print). https://doi.org/10.1016/j.aci.2018.08.003 Touzani, S., Granderson, J., & Fernandes, S. (2018). Gradient boosting machine for modeling the energy consumption of commercial buildings. Energy and Buildings, 158. https://doi.org/10.1016/j.enbuild.2017.11.039 van Rossum, G. (1995). Python tutorial (Issue R 9526). CWI. Wang, H., Li, Y., Ning, H., Wilkins, J., Lloyd-Jones, D., & Luo, Y. (2019). Using Machine Learning to Integrate Socio-Behavioral Factors in Predicting Cardiovascular-Related Mortality Risk. Studies in Health Technology and Informatics, 264, 433–437. https://doi.org/10.3233/SHTI190258 Ward, A., Sarraju, A., Chung, S., Li, J., Harrington, R., Heidenreich, P., Palaniappan, L., Scheinker, D., & Rodriguez, F. (2020). Machine learning and atherosclerotic cardiovascular disease risk prediction in a multi-ethnic population. Npj Digital Medicine, 3(1), 125. https://doi.org/10.1038/s41746-020-00331-1 Weng, S. F., Reps, J., Kai, J., Garibaldi, J. M., & Qureshi, N. (2017). Can machine-learning improve cardiovascular risk prediction using routine clinical data? PloS One, 12(4), e0174944–e0174944. https://doi.org/10.1371/journal.pone.0174944 Wiens, J., & Shenoy, E. S. (2018). Machine Learning for Healthcare: On the Verge of a Major Shift in Healthcare Epidemiology. Clinical Infectious Diseases, 66(1), 149–153. https://doi.org/10.1093/cid/cix731 Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining, 29–39. Yu, L., & Liu, H. (2003). Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution. |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.spa.fl_str_mv |
80 páginas |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Universidad Nacional de Colombia - Sede Medellín |
dc.publisher.program.spa.fl_str_mv |
Medellín - Minas - Maestría en Ingeniería - Analítica |
dc.publisher.department.spa.fl_str_mv |
Departamento de la Computación y la Decisión |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Minas |
dc.publisher.place.spa.fl_str_mv |
Medellín |
dc.publisher.branch.spa.fl_str_mv |
Universidad Nacional de Colombia - Sede Medellín |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/79641/4/license.txt https://repositorio.unal.edu.co/bitstream/unal/79641/5/1152700918.2020.pdf https://repositorio.unal.edu.co/bitstream/unal/79641/6/license_rdf https://repositorio.unal.edu.co/bitstream/unal/79641/7/1152700918.2020.pdf.jpg |
bitstream.checksum.fl_str_mv |
cccfe52f796b7c63423298c2d3365fc6 09fe739709745fe64c66731e2428eb68 f7d494f61e544413a13e6ba1da2089cd 627ba5dc9d45a4b100486d7beffc67c3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089763252076544 |
spelling |
Atribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Villa Garzón, Fernán Alonso9c83ea56495b8f17a79c27fd0001bb81Londoño Ocampo, Manuelac5befdd5d3cfbb2a4ecdae337dcde6612021-06-16T16:54:06Z2021-06-16T16:54:06Z2020https://repositorio.unal.edu.co/handle/unal/79641Universidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; en Colombia la situación es similar. Para la estimación del riesgo cardiovascular se han creado diferentes métodos que analizan el desarrollo de este tipo de enfermedades según el grado de exposición a algunos factores de riesgo, pero estos no suelen ser precisos en todas las poblaciones. El aprendizaje de máquinas ha demostrado su valor de aplicación en contextos médicos, siendo una herramienta novedosa y alternativa que apoya tareas complejas como el diagnóstico de enfermedades. En el presente trabajo se consideran tres modelos de aprendizaje de máquinas, usados en tareas de clasificación que, según la revisión de la literatura desarrollada, pueden ser óptimos en información clínica, con lo que se pretende identificar para una población colombiana de adultos mayores el riesgo asociado al padecimiento de enfermedades cardiovasculares. Para la evaluación del desempeño de los modelos propuestos se utilizan criterios de bondad de ajuste como exactitud, sensibilidad, precisión y f1-score, donde el modelo óptimo se obtiene con el algoritmo de máquina de aumento de gradiente, con un rendimiento mejor a los reportados por estudios similares referenciados.Figures of the World Health Organization (WHO) demonstrated that cardiovascular disease (CVD) is the first cause of death worldwide. The risk of suffering is higher in older people and increases with some preview’s pathologies like hypertension, diabetes, obesity, and smoking. The tendency is equal in Colombia. To estimate cardiovascular risk, different methods have been created that analyze the development of this type of disease according to the degree of exposure to different risk factors, but these are not usually accurate in all populations. Machine learning has proven its application value in medical contexts, being a novel and alternative tool that supports complex tasks such as disease diagnosis. For the present work, three models of machine learning are considered, used in classification tasks that, according to the review of the developed literature may be optimal for clinical information with which it is intended to identify risk for a Colombian population of older adults associated with the suffering of cardiovascular diseases. For the evaluation of the performance of the proposed models, goodness of fit criteria such as accuracy, sensitivity, precision and f1-score are used, where the optimal model is obtained with the gradient boosting machine algorithm, with a better performance than those reported by similar studies referenced.MaestríaMagíster en Ingeniería – Analítica80 páginasapplication/pdfspaUniversidad Nacional de Colombia - Sede MedellínMedellín - Minas - Maestría en Ingeniería - AnalíticaDepartamento de la Computación y la DecisiónFacultad de MinasMedellínUniversidad Nacional de Colombia - Sede Medellín000 - Ciencias de la computación, información y obras generalesEnfermedades cardíacas - DiagnósticoInformática en saludAprendizaje de máquinasRiesgo cardiovascularInformática de la saludMachine Learningcardiovascular riskHealth informaticsDefinición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinasDefinition of a cardiovascular risk classification model for a population of older adults using machine learning techniquesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMLaReferenciaAkoglu, H. (2018). User’s guide to correlation coefficients. Turkish Journal of Emergency Medicine, 18(3), 91–93. https://doi.org/https://doi.org/10.1016/j.tjem.2018.08.001Alaa, A. M., Bolton, T., Di Angelantonio, E., Rudd, J. H. F., & van der Schaar, M. (2019). Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLOS ONE, 14(5), e0213653. https://doi.org/10.1371/journal.pone.0213653Alizadehsani, R., Roshanzamir, M., Hussain, S., Khosravi, A., Koohestani, A., Zangooei, M. H., Abdar, M., Beykikhoshk, A., Shoeibi, A., Zare, A., Panahiazar, M., Nahavandi, S., Srinivasan, D., Atiya, A. F., & Acharya, U. R. (2020). Handling of uncertainty in medical data using machine learning and probability theory techniques: A review of 30 years (1991-2020). http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2008.10114&lang=es&site=eds-liveAlonso, J. C., & Munoz, A. F. (2014). Interpretación de variables Dummy en modelos loglin. Apuntes de Economıa No. 40.Álvarez Ceballos, J. C., Álvarez Múñoz, A., Carvajal Gutiérrez, W., González, M. M., Duque, J. L., & Nieto Cárdenas, O. A. (2017). Determinación del riesgo cardiovascular en una población. Revista Colombiana de Cardiologia, 24(4), 334–341. https://doi.org/10.1016/j.rccar.2016.08.002Álvarez Cosmea, A. (2001). Las tablas de riesgo cardiovascular: Una revisión crítica. MEDIFAM, 11(3), 122–139. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1131-57682001000300002Amón Uribe, I. (2010). Guía metodológica para la selección de técnicas de depuración de datos [Tesis de maestría]. Universidad Nacional de Colombia.Ashfaq, A., & Nowaczyk, S. (2019). Machine learning in healthcare - a system’s perspective. In A. V. B. Aditya Prakash Shweta Bansal, Adam Sadelik (Ed.), Proceedings of the ACM SIGKDD Workshop on Epidemiology meets Data Mining and Knowledge Discovery (epiDAMIK) (pp. 14–17). http://hh.diva-portal.org/smash/get/diva2:1342677/FULLTEXT01.pdfAvila-Chaurand, R., Prado-León, L. R., & González-Muñoz, E. L. (2001). Dimensiones antropométricas de la población latinoamericana: México, Cuba, Colombia, Chile. Centro Universitario de Arte, Arquitectura y Diseño, UDG. 1a Ed. Guadalajara Jalisco.Bandyopadhyay, S., Wolfson, J., Vock, D. M., Vazquez-Benitez, G., Adomavicius, G., Elidrisi, M., Johnson, P. E., & O’Connor, P. J. (2015). Data mining for censored time-to-event data: a Bayesian network model for predicting cardiovascular risk from electronic health record data. Data Mining and Knowledge Discovery, 29(4), 1033–1069. https://doi.org/10.1007/s10618-014-0386-6Basu, T., Engel-Wolf, S., & Menzer, O. (2020). The ethics of machine learning in medical sciences: Where do we stand today? Indian Journal of Dermatology, 65(5), 358–364. http://10.0.16.7/ijd.IJD_419_20Beard, J., Officer, A., Cassels, A., Bustreo, F., Worning, A. M., & Asamoa-Baah, A. (2015). Informe mundial sobre el envejecimiento y la salud. OMS.Bedoya-Mejía, S., Henao-Valencia, C., & Cardona-Arango, D. (2019). Mortalidad por enfermedades del sistema circulatorio, en los municipios del área metropolitana, Antioquia, 1998-2014. Revista Facultad Nacional de Salud Pública, 37(1), 96–105.Bellamy, D., Celi, L., & Beam, A. L. (2020). Evaluating Progress on Machine Learning for Longitudinal Electronic Healthcare Data. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=edsarx&AN=edsarx.2010.01149&lang=es&site=eds-liveBengio, S., Weston, J., & Grangier, D. (2010). Label Embedding Trees for Large Multi-Class Tasks. In J. Lafferty, C. Williams, J. Shawe-Taylor, R. Zemel, & A. Culotta (Eds.), Advances in Neural Information Processing Systems (Vol. 23, pp. 163–171). Curran Associates, Inc. https://proceedings.neurips.cc/paper/2010/file/06138bc5af6023646ede0e1f7c1eac75-Paper.pdfBerthold, M., Cebron, N., Dill, F., Gabriel, T., Kötter, T., Meinl, T., Ohl, P., Thiel, K., & Wiswedel, B. (2009). KNIME - The Konstanz information miner : Version 2.0 and Beyond. SIGKDD Explorations, 11, 26–31.Bhatti, S., Kehar, V., & Memon, M. A. (2020). Prognosis of Diabetes by Performing Data Mining of HbA1c. International Journal of Computer Science and Information Security (IJCSIS), 18(1).Blagus, R., & Lusa, L. (2013). SMOTE for high-dimensional class-imbalanced data. BMC Bioinformatics, 14, 106. https://doi.org/10.1186/1471-2105-14-106Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32.Cardona Alzate, N. I. (2019). Predicción y selección de variables con bosques aleatorios en presencia de variables correlacionadas [Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/bitstream/handle/unal/75561/8063120.2019.pdf?sequence=1Castellanos Vázquez, J., Moreno, A. S., Herrera, C. B., & Sautto Vallejo, J. M. (2019). Valoración de riesgo cardiovascular mediante modelos de clasificación. Investigación Operacional, 40(1), 80–87. http://ezproxy.unal.edu.co/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=133858008&lang=es&site=eds-liveChitarroni, H. (2002). La regresión logística. http://www.salvador.edu.ar/csoc/idicsoLey 1581 de 2012 - Ley Estatutaria de Hábeas Data, (2012). http://bibliotecadigital.ccb.org.co/bitstream/handle/11520/13629/Ley 1581 de 2012.pdf?sequence=1Cosma, G., Acampora, G., Brown, D., Rees, R. C., Khan, M., & Pockley, A. G. (2016). Prediction of Pathological Stage in Patients with Prostate Cancer: A Neuro-Fuzzy Model. PLOS ONE, 11(6), e0155856. https://doi.org/10.1371/journal.pone.0155856Das, R. (2010). A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert Systems with Applications, 37(2), 1568–1572. https://doi.org/10.1016/j.eswa.2009.06.040Díaz-Realpe, J. E., Muñoz-Martínez, J., & Sierra-Torres, C. H. (2007). Factores de riesgo para enfermedad cardiovascular en trabajadores de una institución prestadora de servicios de salud, Colombia. Revista de Salud Pública, 9, 64–75.Estrada, J., Camacho, J. A., Restrepo, M. T., & Parra, C. M. (1998). Parámetros antropométricos de la población laboral colombiana, 1995. Revista Facultad Nacional de Salud Pública, 32, 64–78.Fernando, M., & Arrieta, C. (2005). Estudio sociológico y del conocimiento de los factores de riesgo de las enfermedades cardiovasculares en la Costa Caribe Colombiana (Estudio Caribe). Revista Colombiana de Cardiología, 12, 122–128.Gislason, P. O., Benediktsson, J. A., & Sveinsson, J. R. (2005). Random Forests for land cover classification. Pattern Recognition Letters, 27, 294–300. https://doi.org/10.1016/j.patrec.2005.08.011Gómez, L. A. (2011). Las enfermedades cardiovasculares: un problema de salud pública y un reto global. Biomédica, 31(4).Hameed, N., Shabut, A. M., Ghosh, M. K., & Hossain, M. A. (2020). Multi-class multi-level classification algorithm for skin lesions classification using machine learning techniques. Expert Systems with Applications, 141, 112961. https://doi.org/10.1016/j.eswa.2019.112961Instituto Nacional de Salud de Colombia (INS). (2013). Observatorio Nacional de Salud (ONS) Boletín N0.1. https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/IA/INS/Boletin-tecnico-1-ONS.pdfJamthikar, A., Gupta, D., Khanna, N. N., Saba, L., Laird, J. R., & Suri, J. S. (2020). Cardiovascular/stroke risk prevention: A new machine learning framework integrating carotid ultrasound image-based phenotypes and its harmonics with conventional risk factors. Indian Heart Journal, 72(4), 258–264. https://doi.org/https://doi.org/10.1016/j.ihj.2020.06.004Kalantari, A., Kamsin, A., Shamshirbandb, S., Gani, A., Alinejad Rokny, H., & Chronopoulos, A. T. (2018). Computational intelligence approaches for classification of medical data: State-of-the-art, future challenges and research directions. Neurocomputing, 276.Khan, S. U., Islam, N., Jan, Z., Din, I. U., Khan, A., & Faheem, Y. (2019). An e-Health care services framework for the detection and classification of breast cancer in breast cytology images as an IoMT application. Future Generation Computer Systems, 98, 286–296. https://doi.org/10.1016/j.future.2019.01.033Lemaître, G., Nogueira, F., & Aridas, C. K. (2017). Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. The Journal of Machine Learning Research, 18(1), 559–563.Llibre Guerra, J. C., Guerra Hernández, M. A., & Perera Miniet, E. (2008). Comportamiento de las enfermedades crónicas no transmisibles en adultos mayores. Revista Cubana de Medicina General Integral, 24(4), 0.Lobos Bejarano, J. M., & Brotons Cuixart, C. (2011). Factores de riesgo cardiovascular y atención primaria: evaluación e intervención. Atención Primaria, 43(12), 668–677. https://doi.org/https://doi.org/10.1016/j.aprim.2011.10.002Lopera, M. M. (2017). Revisión comentada de la legislación colombiana en ética de la investigación en salud. Biomedica, 37(4), 1–44. https://doi.org/10.7705/biomedica.v37i4.3333López-Martínez, F., Núñez-Valdez, E. R., García-Díaz, V., & Bursac, Z. (2020). A Case Study for a Big Data and Machine Learning Platform to Improve Medical Decision Support in Population Health Management. Algorithms, 13(4), 102. http://10.0.13.62/a13040102Loreto, M., Lisboa, T., & Moreira, V. P. (2020). Early prediction of ICU readmissions using classification algorithms. Computers in Biology and Medicine, 118, 103636. https://doi.org/10.1016/j.compbiomed.2020.103636Luengo Pérez, L. M., Urbano Gálvez, J. M., & Pérez Miranda, M. (2009). Validación de índices antropométricos alternativos como marcadores del riesgo cardiovascular. Endocrinologia y Nutricion, 56(9), 439–446. https://doi.org/10.1016/S1575-0922(09)72964-XMa, H., Wang, L., & Shen, B. (2011). A new fuzzy support vector machines for class imbalance learning. 2011 International Conference on Electrical and Control Engineering, 3781–3784. https://doi.org/10.1109/ICECENG.2011.6056838Martínez, E. A. B., Ramírez, A. F., & Villamil, E. S. (2016). Modelos predictivos de riesgo cardiovascular. Revista Cuarzo, 22(2), 80–91.Melillo, P., Izzo, R., Orrico, A., Scala, P., Attanasio, M., Mirra, M., De Luca, N., & Pecchia, L. (2015). Automatic Prediction of Cardiovascular and Cerebrovascular Events Using Heart Rate Variability Analysis. PLoS ONE, 10(3), 1–14. http://10.0.5.91/journal.pone.0118504Mierswa, I., Wurst, M., Klinkenberg, R., Scholz, M., & Euler, T. (2006). YALE: Rapid Prototyping for Complex Data Mining Tasks. In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Vol. 2006). https://doi.org/10.1145/1150402.1150531Resolucion 8430 de 1993, (1993). Ministerio de Salud y Protección Social de Colombia. (2013). Envejecimiento demográfico. Colombia 1951-2020 dinámica demográfica y estructuras poblacionales.Moine, J. M. (2013). Metodologías para el descubrimiento de conocimiento en bases de datos: un estudio comparativo.Monroy-de-Jesús, J., Guadalupe-Ramírez, A., Ambriz-Polo, J., & López-González, E. (2018). Algoritmo de aprendizaje eficiente para tratar el problema del desbalance de múltiples clases. Research in Computing Science, 147, 143–157. https://doi.org/10.13053/rcs-147-5-11Muñoz, O. M., García, Á. A., Fernández-Ávila, D., Higuera, A., Ruiz, Á. J., Aschner, P., Toro, J. M., Arteaga, J. M., Merchán, A., Sánchez, G., & Villalba, Y. (2015). Guía de práctica clínica para la prevención, detección temprana, diagnóstico, tratamiento y seguimiento de las dislipidemias: evaluación del riesgo cardiovascular. Revista Colombiana de Cardiología, 22(6), 263–269. https://doi.org/https://doi.org/10.1016/j.rccar.2015.04.009Muñoz, O. M., Rodríguez, N. I., Ruiz, Á., & Rondón, M. (2014). Validación de los modelos de predicción de Framingham y PROCAM como estimadores del riesgo cardiovascular en una población colombiana. Revista Colombiana de Cardiología, 21(4), 202–212. https://doi.org/https://doi.org/10.1016/j.rccar.2014.02.001Muñoz V, O. M., Ruiz Morales, Á. J., Mariño Correa, A., & Bustos C., M. M. (2017). Concordancia entre los modelos de SCORE y Framingham y las ecuaciones AHA/ACC como evaluadores de riesgo cardiovascular. Revista Colombiana de Cardiología, 24(2), 110–116. https://doi.org/https://doi.org/10.1016/j.rccar.2016.06.013Navarro Céspedes, J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para Datos Categóricos. Aplicación en HTA. . Universidad Central “Marta Abreu” de Las Villas.O’Donnell, C. J., & Elosua, R. (2008). Cardiovascular risk factors. Insights from framingham heart study. Revista Espanola de Cardiologia, 61(3), 299–310. https://doi.org/10.1157/13116658OMS. (2008). Prevención de las enfermedades cardiovasculares: guía de bolsillo para la estimación y el manejo del riesgo cardiovascular. Organización Mundial de la Salud.OMS. (2014). Global status report on noncommunicable diseases 2014 (Issue WHO/NMH/NVI/15.1). World Health Organization.Otero, J., & Sánchez, L. (2007). Disenos experimentales y tests estadısticos, tendencias actuales en Machine Learning. V Congreso Espanol Sobre Metaheurısticas, Algoritmos Evolutivos y Bioinspirados (MAEB’07). Universidad de La Laguna. Puerto de La Cruz (Espana, 2007), 295–302.Padmanabhan, M., Yuan, P., Chada, G., & Nguyen, H. Van. (2019). Physician-Friendly Machine Learning: A Case Study with Cardiovascular Disease Risk Prediction. Journal of Clinical Medicine, 8(7), 1050. https://doi.org/10.3390/jcm8071050Patiño-Villada, F. A., Arango-Vélez, E. F., Quintero-Velásquez, M. A., & Arenas-Sosa, M. M. (2011). Cardiovascular risk factors in an urban Colombia population. Revista de Salud Pública, 13(3), 433–445.Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., Duchesnay, E., & Louppe, G. (2012). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12.Plazzotta, F., Luna, D., & González Bernaldo de Quirós, F. (2015). Sistemas de Información en Salud: Integrando datos clínicos en diferentes escenarios y usuarios . In Revista Peruana de Medicina Experimental y Salud Publica (Vol. 32, pp. 343–351). scielo .Prasad, N. R., Almanza-Garcia, S., & Lu, T. T. (2009). Anomaly detection. Computers, Materials and Continua, 14(1), 1–22. https://doi.org/10.1145/1541880.1541882R Core Team. (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing. http://www.r-project.org/Ramírez-Vélez, R., Agredo, R. A., Jerez, A. M., & Chapal, L. Y. (2008). Calidad de vida y condiciones de salud en adultos mayores no institucionalizados en Cali, Colombia. Revista de Salud Pública, 10, 529–536.Restrepo, L. F., & González, J. (2007). From Pearson to Spearman. Revista Colombiana de Ciencias Pecuarias, 20(2). http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-06902007000200010Sangra, R. A., & Codina, A. F. (2015). Identificación, impacto y tratamiento de datos perdidos y atípicos en epidemiología nutricional. Rev Esp Nutr Comunitaria, 21(Supl 1), 188–194.Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/https://doi.org/10.1016/j.ipm.2009.03.002Suzuki, S., Yamashita, T., Sakama, T., Arita, T., Yagi, N., Otsuka, T., Semba, H., Kano, H., Matsuno, S., Kato, Y., Uejima, T., Oikawa, Y., Matsuhama, M., & Yajima, J. (2019). Comparison of risk models for mortality and cardiovascular events between machine learning and conventional logistic regression analysis. PLOS ONE, 14(9), e0221911. https://doi.org/10.1371/journal.pone.0221911Tharwat, A. (2020). Classification assessment methods. In Applied Computing and Informatics: Vol. ahead-of-p (Issue ahead-of-print). https://doi.org/10.1016/j.aci.2018.08.003Touzani, S., Granderson, J., & Fernandes, S. (2018). Gradient boosting machine for modeling the energy consumption of commercial buildings. Energy and Buildings, 158. https://doi.org/10.1016/j.enbuild.2017.11.039van Rossum, G. (1995). Python tutorial (Issue R 9526). CWI.Wang, H., Li, Y., Ning, H., Wilkins, J., Lloyd-Jones, D., & Luo, Y. (2019). Using Machine Learning to Integrate Socio-Behavioral Factors in Predicting Cardiovascular-Related Mortality Risk. Studies in Health Technology and Informatics, 264, 433–437. https://doi.org/10.3233/SHTI190258Ward, A., Sarraju, A., Chung, S., Li, J., Harrington, R., Heidenreich, P., Palaniappan, L., Scheinker, D., & Rodriguez, F. (2020). Machine learning and atherosclerotic cardiovascular disease risk prediction in a multi-ethnic population. Npj Digital Medicine, 3(1), 125. https://doi.org/10.1038/s41746-020-00331-1Weng, S. F., Reps, J., Kai, J., Garibaldi, J. M., & Qureshi, N. (2017). Can machine-learning improve cardiovascular risk prediction using routine clinical data? PloS One, 12(4), e0174944–e0174944. https://doi.org/10.1371/journal.pone.0174944Wiens, J., & Shenoy, E. S. (2018). Machine Learning for Healthcare: On the Verge of a Major Shift in Healthcare Epidemiology. Clinical Infectious Diseases, 66(1), 149–153. https://doi.org/10.1093/cid/cix731Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining, 29–39.Yu, L., & Liu, H. (2003). Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution.LICENSElicense.txtlicense.txttext/plain; charset=utf-83964https://repositorio.unal.edu.co/bitstream/unal/79641/4/license.txtcccfe52f796b7c63423298c2d3365fc6MD54ORIGINAL1152700918.2020.pdf1152700918.2020.pdfTesis Maestría en Ingeniería - Analíticaapplication/pdf2367950https://repositorio.unal.edu.co/bitstream/unal/79641/5/1152700918.2020.pdf09fe739709745fe64c66731e2428eb68MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8799https://repositorio.unal.edu.co/bitstream/unal/79641/6/license_rdff7d494f61e544413a13e6ba1da2089cdMD56THUMBNAIL1152700918.2020.pdf.jpg1152700918.2020.pdf.jpgGenerated Thumbnailimage/jpeg5217https://repositorio.unal.edu.co/bitstream/unal/79641/7/1152700918.2020.pdf.jpg627ba5dc9d45a4b100486d7beffc67c3MD57unal/79641oai:repositorio.unal.edu.co:unal/796412024-07-19 23:32:38.855Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.coUExBTlRJTExBIERFUMOTU0lUTwoKQ29tbyBlZGl0b3IgZGUgZXN0ZSDDrXRlbSwgdXN0ZWQgcHVlZGUgbW92ZXJsbyBhIHJldmlzacOzbiBzaW4gYW50ZXMgcmVzb2x2ZXIgbG9zIHByb2JsZW1hcyBpZGVudGlmaWNhZG9zLCBkZSBsbyBjb250cmFyaW8sIGhhZ2EgY2xpYyBlbiBHdWFyZGFyIHBhcmEgZ3VhcmRhciBlbCDDrXRlbSB5IHNvbHVjaW9uYXIgZXN0b3MgcHJvYmxlbWFzIG1hcyB0YXJkZS4KCk5PVEFTOgoqU0kgTEEgVEVTSVMgQSBQVUJMSUNBUiBBRFFVSVJJw5MgQ09NUFJPTUlTT1MgREUgQ09ORklERU5DSUFMSURBRCBFTiBFTCBERVNBUlJPTExPIE8gUEFSVEVTIERFTCBET0NVTUVOVE8uIFNJR0EgTEEgRElSRUNUUklaIERFIExBIFJFU09MVUNJw5NOIDAyMyBERSAyMDE1LCBQT1IgTEEgQ1VBTCBTRSBFU1RBQkxFQ0UgRUwgUFJPQ0VESU1JRU5UTyBQQVJBIExBIFBVQkxJQ0FDScOTTiBERSBURVNJUyBERSBNQUVTVFLDjUEgWSBET0NUT1JBRE8gREUgTE9TIEVTVFVESUFOVEVTIERFIExBIFVOSVZFUlNJREFEIE5BQ0lPTkFMIERFIENPTE9NQklBIEVOIEVMIFJFUE9TSVRPUklPIElOU1RJVFVDSU9OQUwgVU4sIEVYUEVESURBIFBPUiBMQSBTRUNSRVRBUsONQSBHRU5FUkFMLgoqTEEgVEVTSVMgQSBQVUJMSUNBUiBERUJFIFNFUiBMQSBWRVJTScOTTiBGSU5BTCBBUFJPQkFEQS4KUGFyYSB0cmFiYWpvcyBkZXBvc2l0YWRvcyBwb3Igc3UgcHJvcGlvIGF1dG9yOiBBbCBhdXRvYXJjaGl2YXIgZXN0ZSBncnVwbyBkZSBhcmNoaXZvcyBkaWdpdGFsZXMgeSBzdXMgbWV0YWRhdG9zLCBZbyBnYXJhbnRpem8gYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBVTiBlbCBkZXJlY2hvIGEgYWxtYWNlbmFybG9zIHkgbWFudGVuZXJsb3MgZGlzcG9uaWJsZXMgZW4gbMOtbmVhIGRlIG1hbmVyYSBncmF0dWl0YS4gRGVjbGFybyBxdWUgZGljaG8gbWF0ZXJpYWwgZXMgZGUgbWkgcHJvcGllZGFkIGludGVsZWN0dWFsIHkgcXVlIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwgVU4gbm8gYXN1bWUgbmluZ3VuYSByZXNwb25zYWJpbGlkYWQgc2kgaGF5IGFsZ3VuYSB2aW9sYWNpw7NuIGEgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGFsIGRpc3RyaWJ1aXIgZXN0b3MgYXJjaGl2b3MgeSBtZXRhZGF0b3MuIChTZSByZWNvbWllbmRhIGEgdG9kb3MgbG9zIGF1dG9yZXMgYSBpbmRpY2FyIHN1cyBkZXJlY2hvcyBkZSBhdXRvciBlbiBsYSBww6FnaW5hIGRlIHTDrXR1bG8gZGUgc3UgZG9jdW1lbnRvLikgRGUgbGEgbWlzbWEgbWFuZXJhLCBhY2VwdG8gbG9zIHTDqXJtaW5vcyBkZSBsYSBzaWd1aWVudGUgbGljZW5jaWE6IExvcyBhdXRvcmVzIG8gdGl0dWxhcmVzIGRlbCBkZXJlY2hvIGRlIGF1dG9yIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8gY29uZmllcmVuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSwgbGltaXRhZGEgeSBncmF0dWl0YSBzb2JyZSBsYSBvYnJhIHF1ZSBzZSBpbnRlZ3JhIGVuIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwsIHF1ZSBzZSBhanVzdGEgYSBsYXMgc2lndWllbnRlcyBjYXJhY3RlcsOtc3RpY2FzOiBhKSBFc3RhcsOhIHZpZ2VudGUgYSBwYXJ0aXIgZGUgbGEgZmVjaGEgZW4gcXVlIHNlIGluY2x1eWUgZW4gZWwgcmVwb3NpdG9yaW8sIHF1ZSBzZXLDoW4gcHJvcnJvZ2FibGVzIGluZGVmaW5pZGFtZW50ZSBwb3IgZWwgdGllbXBvIHF1ZSBkdXJlIGVsIGRlcmVjaG8gcGF0cmltb25pYWwgZGVsIGF1dG9yLiBFbCBhdXRvciBwb2Ryw6EgZGFyIHBvciB0ZXJtaW5hZGEgbGEgbGljZW5jaWEgc29saWNpdMOhbmRvbG8gYSBsYSBVbml2ZXJzaWRhZC4gYikgTG9zIGF1dG9yZXMgYXV0b3JpemFuIGEgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgcGFyYSBwdWJsaWNhciBsYSBvYnJhIGVuIGVsIGZvcm1hdG8gcXVlIGVsIHJlcG9zaXRvcmlvIGxvIHJlcXVpZXJhIChpbXByZXNvLCBkaWdpdGFsLCBlbGVjdHLDs25pY28gbyBjdWFscXVpZXIgb3RybyBjb25vY2lkbyBvIHBvciBjb25vY2VyKSB5IGNvbm9jZW4gcXVlIGRhZG8gcXVlIHNlIHB1YmxpY2EgZW4gSW50ZXJuZXQgcG9yIGVzdGUgaGVjaG8gY2lyY3VsYSBjb24gdW4gYWxjYW5jZSBtdW5kaWFsLiBjKSBMb3MgYXV0b3JlcyBhY2VwdGFuIHF1ZSBsYSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgYSB0w610dWxvIGdyYXR1aXRvLCBwb3IgbG8gdGFudG8sIHJlbnVuY2lhbiBhIHJlY2liaXIgZW1vbHVtZW50byBhbGd1bm8gcG9yIGxhIHB1YmxpY2FjacOzbiwgZGlzdHJpYnVjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSB5IGN1YWxxdWllciBvdHJvIHVzbyBxdWUgc2UgaGFnYSBlbiBsb3MgdMOpcm1pbm9zIGRlIGxhIHByZXNlbnRlIGxpY2VuY2lhIHkgZGUgbGEgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBjb24gcXVlIHNlIHB1YmxpY2EuIGQpIExvcyBhdXRvcmVzIG1hbmlmaWVzdGFuIHF1ZSBzZSB0cmF0YSBkZSB1bmEgb2JyYSBvcmlnaW5hbCBzb2JyZSBsYSBxdWUgdGllbmVuIGxvcyBkZXJlY2hvcyBxdWUgYXV0b3JpemFuIHkgcXVlIHNvbiBlbGxvcyBxdWllbmVzIGFzdW1lbiB0b3RhbCByZXNwb25zYWJpbGlkYWQgcG9yIGVsIGNvbnRlbmlkbyBkZSBzdSBvYnJhIGFudGUgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgeSBhbnRlIHRlcmNlcm9zLiBFbiB0b2RvIGNhc28gbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgc2UgY29tcHJvbWV0ZSBhIGluZGljYXIgc2llbXByZSBsYSBhdXRvcsOtYSBpbmNsdXllbmRvIGVsIG5vbWJyZSBkZWwgYXV0b3IgeSBsYSBmZWNoYSBkZSBwdWJsaWNhY2nDs24uIGUpIExvcyBhdXRvcmVzIGF1dG9yaXphbiBhIGxhIFVuaXZlcnNpZGFkIHBhcmEgaW5jbHVpciBsYSBvYnJhIGVuIGxvcyDDrW5kaWNlcyB5IGJ1c2NhZG9yZXMgcXVlIGVzdGltZW4gbmVjZXNhcmlvcyBwYXJhIHByb21vdmVyIHN1IGRpZnVzacOzbi4gZikgTG9zIGF1dG9yZXMgYWNlcHRhbiBxdWUgbGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgZGUgQ29sb21iaWEgcHVlZGEgY29udmVydGlyIGVsIGRvY3VtZW50byBhIGN1YWxxdWllciBtZWRpbyBvIGZvcm1hdG8gcGFyYSBwcm9ww7NzaXRvcyBkZSBwcmVzZXJ2YWNpw7NuIGRpZ2l0YWwuIFNJIEVMIERPQ1VNRU5UTyBTRSBCQVNBIEVOIFVOIFRSQUJBSk8gUVVFIEhBIFNJRE8gUEFUUk9DSU5BRE8gTyBBUE9ZQURPIFBPUiBVTkEgQUdFTkNJQSBPIFVOQSBPUkdBTklaQUNJw5NOLCBDT04gRVhDRVBDScOTTiBERSBMQSBVTklWRVJTSURBRCBOQUNJT05BTCBERSBDT0xPTUJJQSwgTE9TIEFVVE9SRVMgR0FSQU5USVpBTiBRVUUgU0UgSEEgQ1VNUExJRE8gQ09OIExPUyBERVJFQ0hPUyBZIE9CTElHQUNJT05FUyBSRVFVRVJJRE9TIFBPUiBFTCBSRVNQRUNUSVZPIENPTlRSQVRPIE8gQUNVRVJETy4KUGFyYSB0cmFiYWpvcyBkZXBvc2l0YWRvcyBwb3Igb3RyYXMgcGVyc29uYXMgZGlzdGludGFzIGEgc3UgYXV0b3I6IERlY2xhcm8gcXVlIGVsIGdydXBvIGRlIGFyY2hpdm9zIGRpZ2l0YWxlcyB5IG1ldGFkYXRvcyBhc29jaWFkb3MgcXVlIGVzdG95IGFyY2hpdmFuZG8gZW4gZWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBVTikgZXMgZGUgZG9taW5pbyBww7pibGljby4gU2kgbm8gZnVlc2UgZWwgY2FzbywgYWNlcHRvIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkIHBvciBjdWFscXVpZXIgaW5mcmFjY2nDs24gZGUgZGVyZWNob3MgZGUgYXV0b3IgcXVlIGNvbmxsZXZlIGxhIGRpc3RyaWJ1Y2nDs24gZGUgZXN0b3MgYXJjaGl2b3MgeSBtZXRhZGF0b3MuCkFsIGhhY2VyIGNsaWMgZW4gZWwgc2lndWllbnRlIGJvdMOzbiwgdXN0ZWQgaW5kaWNhIHF1ZSBlc3TDoSBkZSBhY3VlcmRvIGNvbiBlc3RvcyB0w6lybWlub3MuCgpVTklWRVJTSURBRCBOQUNJT05BTCBERSBDT0xPTUJJQSAtIMOabHRpbWEgbW9kaWZpY2FjacOzbiAyNy8yMC8yMDIwCg== |