Machine learning aplicado a la estimación de riesgo ante eventos agudos en población en condición de riesgo cardiovascular - RCV

RESUMEN : La motivación es buena parte influenciada por el contexto de pandemia que se vive desde el año 2020, a causa de la expansión a nivel mundial del virus COVID, donde los servicios de salud se concentraron en atender los pacientes infectados, generando una desantención al resto de enfermedade...

Full description

Autores:
Alzate Cardona, Christian Felipe
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/24589
Acceso en línea:
http://hdl.handle.net/10495/24589
Palabra clave:
Técnicas de diagnóstico cardiovascular
Diagnostic techniques, Cardiovascular
Prevención de enfermedades
Disease prevention
Evaluación de riesgos
Risk assessment
Estimación de riesgo
Eventos agudos
Riesgo cardiovascular
http://aims.fao.org/aos/agrovoc/c_37932
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : La motivación es buena parte influenciada por el contexto de pandemia que se vive desde el año 2020, a causa de la expansión a nivel mundial del virus COVID, donde los servicios de salud se concentraron en atender los pacientes infectados, generando una desantención al resto de enfermedades incluidas las no trasmisibles, como es el caso de las enfermedades cardiovascualres y los eventos agudos relacionados con estos. Debido a esta capacidad reducida en la atención causada volcamiento de los servicios hacia el fenómeno COVID, se vuelve cada vez más valiosa una estratificación del riesgo en el resto enfermedades críticas y en especial una priorización en la atención de los pacientes más propensos a complicaciones en ellas, para un uso adecuado de la capacidad restante. Nos encontramos entonces con la oportunidad y la necesidad de aprovechar los datos que se captan en una compañía prestadora de servicios de salud, de forma que puedan contribuir a la anticipación de las decisiones que se toman con base en la información del pasado y entregar nuevas soluciones analíticas de valor que contribuyan al uso pertinente de los recursos disponibles a partir del conocimiento del negocio, sus procesos y necesidades. Para el desarrollo se cuenta con un grupo anónimo de pacientes con alguna de las tres patologías siguientes, diabetes mellitus, hipertensión arterial o enfermedad renal crónica en estadio 1 al 4, considerándose población en condición de riesgo cardiovascular (RCV); a estos se les indagó acerca de su estado clínico al momento de presentar o no una hospitalización o una urgencia, cruzando con un conjunto de variables que identifican la posibilidad o no de tener comorbilidades adicionales, utilización de servicios y variables de hábitos de vida. Se estimaron diferentes modelos de clasificación, se decidió por la regresión logística por su poder explicativo y sus métricas superiores al resto de los modelos. Obteniendo con este resultado una capacidad predictiva adecuada y que superó los requerimientos del negocio, con una sensibilidad y especificidad del 81% para la regresión con los mejores hiperparámetros y un cutoff optimo en un escenario de una clasificación dicotómica. Además, como se decidió hacer una clasificación multicategórica de la probabilidad de la regresión también se cuenta con la bondad de tener un AUC del 80% generando los segmentos de dichas categorías mediante clustering, garantizando la separación más adecuada en función de la distribución de las probabilidades.