Implementación de un modelo de machine learning para el diagnóstico temprano de diabetes tipo 2
El presente trabajo aborda la problemática del diagnóstico tardío de la diabetes tipo 2, una enfermedad crónica con alta prevalencia mundial. El objetivo fue diseñar e implementar un modelo predictivo de Machine Learning que, utilizando datos clínicos no invasivos y fácilmente obtenibles del BRFSS 2...
- Autores:
-
Marín Ortega, Luis Fernando
Parra Faria, Luisangel Alexander
- Tipo de recurso:
- Fecha de publicación:
- 2025
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/13386
- Acceso en línea:
- http://hdl.handle.net/10584/13386
- Palabra clave:
- Diabetes tipo 2
diagnóstico temprano
BRFSS
machine learning
balanceo de clases
XGBoost
early diagnosis
machine learning
BRFSS
feature selection
class balancing
XGBoost
Type 2 diabetes
- Rights
- License
- Universidad del Norte
Summary: | El presente trabajo aborda la problemática del diagnóstico tardío de la diabetes tipo 2, una enfermedad crónica con alta prevalencia mundial. El objetivo fue diseñar e implementar un modelo predictivo de Machine Learning que, utilizando datos clínicos no invasivos y fácilmente obtenibles del BRFSS 2023, permita identificar individuos en riesgo de diabetes de forma temprana. Se realizó una rigurosa limpieza y selección de variables relevantes mediante análisis estadísticos (correlación de Pearson, chi-cuadrado, ANOVA e información mutua), priorizando aquellas con mayor impacto clínico. Se enfrentó el fuerte desequilibrio de clases mediante técnicas como SMOTE y NearMiss, logrando mejorar la sensibilidad de los modelos. La herramienta PyCaret facilitó el procesamiento, comparación y optimización automática de diferentes algoritmos. Los mejores resultados se obtuvieron con el modelo XGBoost, alcanzando altos valores de precisión y sensibilidad tras el balanceo de datos. El modelo final se integró en un prototipo funcional listo para ser desplegado vía API, demostrando así su potencial como herramienta accesible, eficiente y reproducible para apoyar el diagnóstico temprano de la diabetes tipo 2 en distintos contextos clínicos y comunitarios. |
---|