Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia

El dengue en Colombia y en la región representa una importante problemática de salud pública, por las condiciones geográficas y sociales que hay en el país, se presentan focos cíclicos de contagio. Los avances en machine learning (ML) y ciencia de datos para la clasificación de pacientes puede repre...

Full description

Autores:
Rojas Sánchez, Juan David
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/10797
Acceso en línea:
http://hdl.handle.net/20.500.12495/10797
Palabra clave:
Bioestadística
Machine Learning
Dengue
Clasificación
519.5
Biostatistics
Machine Learning
Dengue
Classification
Rights
openAccess
License
Atribución-NoComercial-CompartirIgual 4.0 Internacional
id UNBOSQUE2_98e83417405d5ed05ba5bd0418710913
oai_identifier_str oai:repositorio.unbosque.edu.co:20.500.12495/10797
network_acronym_str UNBOSQUE2
network_name_str Repositorio U. El Bosque
repository_id_str
dc.title.spa.fl_str_mv Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
dc.title.translated.spa.fl_str_mv Development of a Machine Learning model for the classification of dengue types according to their severity level: A case study of Bucaramanga, Colombia
title Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
spellingShingle Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
Bioestadística
Machine Learning
Dengue
Clasificación
519.5
Biostatistics
Machine Learning
Dengue
Classification
title_short Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
title_full Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
title_fullStr Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
title_full_unstemmed Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
title_sort Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
dc.creator.fl_str_mv Rojas Sánchez, Juan David
dc.contributor.advisor.none.fl_str_mv Ramos Montaña, Jesús David
dc.contributor.author.none.fl_str_mv Rojas Sánchez, Juan David
dc.contributor.orcid.none.fl_str_mv Rojas Sánchez, Juan David [0009-0000-8844-4172]
dc.subject.spa.fl_str_mv Bioestadística
Machine Learning
Dengue
Clasificación
topic Bioestadística
Machine Learning
Dengue
Clasificación
519.5
Biostatistics
Machine Learning
Dengue
Classification
dc.subject.ddc.none.fl_str_mv 519.5
dc.subject.keywords.spa.fl_str_mv Biostatistics
Machine Learning
Dengue
Classification
description El dengue en Colombia y en la región representa una importante problemática de salud pública, por las condiciones geográficas y sociales que hay en el país, se presentan focos cíclicos de contagio. Los avances en machine learning (ML) y ciencia de datos para la clasificación de pacientes puede representar una reducción de esfuerzos médicos, económicos y humanos para el tratamiento de la enfermedad. El diagnóstico temprano, ofrece conocimiento y seguimiento de la enfermedad. Los datos obtenidos provienen del municipio de Bucaramanga, Santander, uno de los departamentos más afectados por los brotes de dengue. Para lograr el objetivo de construir un clasificador de tipos de dengue se construyen 4 modelos ML: Regresión Logística Regularizada (RL), Random Forest (RF), Maquina de Soporte Vectorial para Clasificación (SVC) y una propuesta de ensamble de estos tres modelos que toma como meta-clasificador al algoritmo de XGBoost. Los resultados muestran como mejor modelo al modelo ensamblado (AUC = 0.9386, Accuracy = 0.936, F1-Score = 0.947), seguido de la Regresión Logística regularizada por norma L2 (AUC = 0.95, Accuracy = 0.871, F1-Score = 0.895), la Máquina de Soporte de Vectorial - Kernel Radial (AUC = 0.984, Accuracy = 0.857, F1-Score = 0.867) y por último, el Random Forest (AUC = 0.94, Accuracy = 0.833, F1-Score = 0.865). Además se encontró que factores como antecedentes familiares por dengue, dolor abdominal, vomito y diarrea presentan una relación causal con el presentar dengue con signos de alarma.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-06-10T15:58:55Z
dc.date.available.none.fl_str_mv 2023-06-10T15:58:55Z
dc.date.issued.none.fl_str_mv 2023
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12495/10797
dc.identifier.instname.spa.fl_str_mv instname:Universidad El Bosque
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad El Bosque
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.unbosque.edu.co
url http://hdl.handle.net/20.500.12495/10797
identifier_str_mv instname:Universidad El Bosque
reponame:Repositorio Institucional Universidad El Bosque
repourl:https://repositorio.unbosque.edu.co
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.local.spa.fl_str_mv Acceso abierto
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
http://creativecommons.org/licenses/by-nc-sa/4.0/
Acceso abierto
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Estadística
dc.publisher.grantor.spa.fl_str_mv Universidad El Bosque
dc.publisher.faculty.spa.fl_str_mv Facultad de Ciencias
institution Universidad El Bosque
bitstream.url.fl_str_mv https://repositorio.unbosque.edu.co/bitstreams/867881b0-f12c-42b6-92c1-13ac76bf7a50/download
https://repositorio.unbosque.edu.co/bitstreams/5790cc4a-0db9-40a1-9f68-bae85b43840f/download
https://repositorio.unbosque.edu.co/bitstreams/cb324cc2-2683-4679-9e65-f320064d5002/download
https://repositorio.unbosque.edu.co/bitstreams/f21bb81b-063d-4e9a-bfff-af0f35c49643/download
https://repositorio.unbosque.edu.co/bitstreams/ae7b0089-301f-4ab2-82cd-ca2173b19ff9/download
https://repositorio.unbosque.edu.co/bitstreams/6620964b-6447-4b0e-a961-a66e4bf0fe2e/download
https://repositorio.unbosque.edu.co/bitstreams/9273497b-0a8c-4fcc-bcca-e426097bb12c/download
bitstream.checksum.fl_str_mv 934f4ca17e109e0a05eaeaba504d7ce4
17cc15b951e7cc6b3728a574117320f9
53f72e25d163080978431967b278c87a
eea15e6525fad0eaffaeee46bb98fcd4
9ea517631956ae92b0a2552171281098
4d2f8bb2bece87ec12c699b3720a11f1
a30d3735e59f99068ae04bafbe281379
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad El Bosque
repository.mail.fl_str_mv bibliotecas@biteca.com
_version_ 1828164649208512512
spelling Ramos Montaña, Jesús DavidRojas Sánchez, Juan DavidRojas Sánchez, Juan David [0009-0000-8844-4172]2023-06-10T15:58:55Z2023-06-10T15:58:55Z2023http://hdl.handle.net/20.500.12495/10797instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coEl dengue en Colombia y en la región representa una importante problemática de salud pública, por las condiciones geográficas y sociales que hay en el país, se presentan focos cíclicos de contagio. Los avances en machine learning (ML) y ciencia de datos para la clasificación de pacientes puede representar una reducción de esfuerzos médicos, económicos y humanos para el tratamiento de la enfermedad. El diagnóstico temprano, ofrece conocimiento y seguimiento de la enfermedad. Los datos obtenidos provienen del municipio de Bucaramanga, Santander, uno de los departamentos más afectados por los brotes de dengue. Para lograr el objetivo de construir un clasificador de tipos de dengue se construyen 4 modelos ML: Regresión Logística Regularizada (RL), Random Forest (RF), Maquina de Soporte Vectorial para Clasificación (SVC) y una propuesta de ensamble de estos tres modelos que toma como meta-clasificador al algoritmo de XGBoost. Los resultados muestran como mejor modelo al modelo ensamblado (AUC = 0.9386, Accuracy = 0.936, F1-Score = 0.947), seguido de la Regresión Logística regularizada por norma L2 (AUC = 0.95, Accuracy = 0.871, F1-Score = 0.895), la Máquina de Soporte de Vectorial - Kernel Radial (AUC = 0.984, Accuracy = 0.857, F1-Score = 0.867) y por último, el Random Forest (AUC = 0.94, Accuracy = 0.833, F1-Score = 0.865). Además se encontró que factores como antecedentes familiares por dengue, dolor abdominal, vomito y diarrea presentan una relación causal con el presentar dengue con signos de alarma.EstadísticoPregradoDengue in Colombia and in the region represents a major public health problem, due to the geographical and social conditions in the country, there are cyclical outbreaks of contagion. Advances in machine learning (ML) and data science for the classification of patients may represent a reduction of medical, economic and human efforts for the treatment of the disease. Early diagnosis offers knowledge and monitoring of the disease. The data obtained come from the municipality of Bucaramanga, Santander, one of the departments most affected by dengue outbreaks. To achieve the objective of building a classifier of dengue types, 4 ML models are built: Regularized Logistic Regression (RL), Random Forest (RF), Support Vector Classification Machine (SVC) and a proposal for the assembly of these three models that takes the XGBoost algorithm as meta-classifier. The results show that the best model is the ensemble model (AUC = 0.9386, Accuracy = 0.936, F1-Score = 0.947), followed by the Logistic Regression regularized by norm L2 (AUC = 0.95, Accuracy = 0. 871, F1-Score = 0.895), the Support Vector-Radial Kernel Machine (AUC = 0.984, Accuracy = 0.857, F1-Score = 0.867) and lastly, the Random Forest (AUC = 0.94, Accuracy = 0.833, F1-Score = 0.865). It was also found that factors such as family history of dengue, abdominal pain, vomiting and diarrhea had a causal relationship with the presentation of dengue with alarm signs.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2BioestadísticaMachine LearningDengueClasificación519.5BiostatisticsMachine LearningDengueClassificationDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, ColombiaDevelopment of a Machine Learning model for the classification of dengue types according to their severity level: A case study of Bucaramanga, ColombiaEstadísticaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/867881b0-f12c-42b6-92c1-13ac76bf7a50/download934f4ca17e109e0a05eaeaba504d7ce4MD57LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/5790cc4a-0db9-40a1-9f68-bae85b43840f/download17cc15b951e7cc6b3728a574117320f9MD58Carta.pdfCarta.pdfCarta autorizaciónapplication/pdf391452https://repositorio.unbosque.edu.co/bitstreams/cb324cc2-2683-4679-9e65-f320064d5002/download53f72e25d163080978431967b278c87aMD59THUMBNAILDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad. Un estudio de caso de Bucaramanga, Colombi.pngDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad. Un estudio de caso de Bucaramanga, Colombi.pngPortadaimage/png62099https://repositorio.unbosque.edu.co/bitstreams/f21bb81b-063d-4e9a-bfff-af0f35c49643/downloadeea15e6525fad0eaffaeee46bb98fcd4MD510Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia.jpgDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia.jpgIM Thumbnailimage/jpeg5378https://repositorio.unbosque.edu.co/bitstreams/ae7b0089-301f-4ab2-82cd-ca2173b19ff9/download9ea517631956ae92b0a2552171281098MD511ORIGINALDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, ColombiaDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, ColombiaDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombiaapplication/pdf1120980https://repositorio.unbosque.edu.co/bitstreams/6620964b-6447-4b0e-a961-a66e4bf0fe2e/download4d2f8bb2bece87ec12c699b3720a11f1MD55TEXTDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia.txtDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia.txtExtracted texttext/plain101814https://repositorio.unbosque.edu.co/bitstreams/9273497b-0a8c-4fcc-bcca-e426097bb12c/downloada30d3735e59f99068ae04bafbe281379MD51220.500.12495/10797oai:repositorio.unbosque.edu.co:20.500.12495/107972024-02-07 12:43:01.94http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo=