Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad

El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria p...

Full description

Autores:
Bolívar Rodríguez, Valeria
Bonfante Romero, Luz Valentina
Urbina Reales, María Alejandra
Otero Gómez, Karolay Dayana
Tipo de recurso:
Fecha de publicación:
2025
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/13497
Acceso en línea:
http://hdl.handle.net/10584/13497
Palabra clave:
Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
Rights
License
Universidad del Norte
Description
Summary:El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria prolongada desde su ingreso. El segundo es un modelo de regresión orientado a estimar la duración de la estancia en días. El proyecto partió de una revisión del problema, análisis de factores clínicos y administrativos, y la contextualización del fenómeno a nivel institucional y nacional. Se aplicó la metodología CRISP-DM, desde la comprensión del negocio y análisis de datos clínicos reales hasta la construcción, entrenamiento y validación de los modelos, utilizando aprendizaje automático con el soporte de PyCaret. En la validación, el modelo de clasificación alcanzó un 78% de exactitud, valor aceptable en contextos clínicos complejos, y el modelo de regresión obtuvo un error absoluto medio (MAE) de 2,69 días, evidenciando buena capacidad de estimación. Además, se incorporó el análisis de interpretabilidad mediante valores de Shapley (SHAP), que permitió identificar las variables más influyentes. En el modelo de regresión destacaron la razón entre días de estancia y estudios de imágenes, las interconsultas con otras especialidades y a medicina interna. En el modelo de clasificación, fueron clave la razón entre días y estudios de imágenes, la razón con procedimientos no quirúrgicos y el número de interconsultas a subespecialidades. Estos hallazgos aportan transparencia y permiten detectar posibles cuellos de botella clínicos o administrativos. Se concluye que ambos modelos pueden mejorar la identificación temprana de pacientes con riesgo de estancia prolongada y fortalecer la planificación asistencial basada en datos.