Validación de escalas de predicción de mortalidad en pacientes con enfermedad por coronavirus 2019 en el registro de pacientes rescate COVID19

Introducción: La pandemia causada por la enfermedad por coronavirus 2019 (COVID-19) ha revelado la necesidad de optimizar los recursos en salud. Las herramientas que permiten diferenciar entre poblaciones con diferentes niveles de riesgo como las escalas o modelos de predicción, adquieren gran valor...

Full description

Autores:
Ruiz Bedoya, Custodio Alberto
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/13780
Acceso en línea:
http://hdl.handle.net/20.500.12749/13780
Palabra clave:
Medical sciences
Health sciences
Validation
Mortality
Predictive models
Predictive scales
Pronostics
External validation
Discrimination
Calibration
Virus
Severe acute respiratory syndrome
Coronavirus infections
Patients
Measurement by scales
Ciencias médicas
Virus
Síndrome respiratorio agudo grave
Infecciones por coronavirus
Pacientes
Medición por escalas
Ciencias de la salud
Validación
Modelos de predicción
Escalas de predicción
Pronóstico
Validez externa
Discriminación
Calibración
Enfermedad por coronavirus 2019
COVID-19
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Description
Summary:Introducción: La pandemia causada por la enfermedad por coronavirus 2019 (COVID-19) ha revelado la necesidad de optimizar los recursos en salud. Las herramientas que permiten diferenciar entre poblaciones con diferentes niveles de riesgo como las escalas o modelos de predicción, adquieren gran valor en este nuevo escenario. A la fecha se encuentran disponibles más de 50 escalas de pronóstico en COVID-19 pero la gran mayoría no han tenido procesos de validación externa y aún tienen un bajo potencial de generalización. Objetivo: Evaluar el desempeño de al menos tres escalas de predicción de mortalidad, en términos de su capacidad de discriminación, calibración y potencial generalización a la práctica clínica, al aplicarlas en una cohorte nacional de pacientes con infección por SARS-COV2 (RESCATE COVID-19). Metodología: A partir de una revisión sistemática viva de la literatura que contiene todas las escalas publicadas hasta mayo de 2020 y siguiendo un proceso estructurado, se eligieron las tres con mayor potencial de aplicación local. En cada una se realizó un proceso de caracterización de sus predictores (distribución, análisis bivariado y multivariado con regresión logística múltiple), evaluación de su capacidad de discriminación (área bajo las curvas ROC) y calibración (de manera gráfica y estadística: prueba de bondad de ajuste de Hosmer-Lemeshow, calibración en promedio “CITL”, pendiente de calibración). Además, se analizó el desempeño de los modelos utilizando sus puntajes o niveles de riesgo como variables independientes. Resultados: Tras el proceso de selección resultaron dos estudios orientales (Zhang-China, Xie-China) y uno latinoamericano (Bello-México) como candidatos para su validación local. Los predictores propuestos por los modelos son en su mayoría variables sociodemográficas, antecedentes de comorbilidades, laboratorios generales y algunas derivadas de la atención clínica. Los modelos fueron evaluados en 1342 pacientes con diagnóstico confirmado de COVID-19 que hacen parte de la cohorte RESCATE COVID-19 (mortalidad 12.7%). Esta incluye pacientes atendidos en seis hospitales ubicados 3 diferentes ciudades de Colombia. De los 7 predictores por la escala de Zhang-China solo 2 resultaron con OR significativo tras ser ajustados en un modelo de regresión logística multivariada (edad: OR 1.03; IC95% 1.01-1.06 y proteína C reactiva: OR: 1.07; IC95% 1.03 – 1.10). Su capacidad de discriminación resultó apenas aceptable (AUC: 0.78) y no demostró estar calibrada estadísticamente (HL p=0.002) ni en su evaluación gráfica. Al utilizar sus puntajes (calculados con una herramienta disponible en línea) y niveles de riesgo (según los puntos de corte propuestos) como variables predictoras, la escala tiene menor capacidad de discriminación (AUC: 0.73 y 0.67), persiste sin calibración estadística (HL p<0.05) y su evaluación gráfica empeora. Por su parte todos los predictores propuestos por la escala de Xie-China mostraron una asociación significativa con la mortalidad intrahospitalaria. Su capacidad de discriminación fue buena (AUC: 0.81) y sus predicciones se ajustaron a las observaciones de la cohorte (HL p=0.22). Sin embargo, no fue posible realizar un análisis de la escala de puntos basada en el nomograma que proponen sus autores. Se encontró que se trata de un sistema complejo de puntuación, con alta vulnerabilidad a errores de medición, demandante de tiempo y con poca probabilidad de aplicación a la práctica clínica diaria local. Cuatro de los 9 predictores de la escala Bello-México tuvieron medidas de asociación ajustadas significativas. Su capacidad de discriminación fue buena (AUC:0.80) y demostró calibración estadística (HL p=0.32) y gráfica. El sistema de puntuación como escala y los niveles de riesgo resultaron con mejor desempeño que el modelo (AUC: 0.87) y con muy buena calibración (HL p>0.05). Tras la evaluación de los puntos de corte para su aplicación clínica se eligió el umbral de 4 puntos en la escala para dividir entre alto y bajo riesgo (VPN: 98%, Sensibilidad del 90%). Conclusiones: La escala de Bello-México resultó tener muy buen desempeño al aplicarse a los pacientes con diagnóstico de COVID-19 de la cohorte RESCATE-COVID19. Su sistema de puntuación sencillo, con buena capacidad de discriminación entre pacientes de alto y bajo riesgo, ofrece predicciones calibradas de las probabilidades de mortalidad intrahospitalaria. Teniendo en cuenta la naturaleza de sus predictores se considera útil en escenarios de atención temprana de pacientes con diagnóstico o sospecha de la enfermedad. Con un punto de corte de 4 puntos la escala resulta útil como estrategia de tamización del pronóstico ya que puntajes menores tienen muy baja tasa de falsos negativos. Su uso puede informar mejor (aunque no reemplazar) la decisión clínica y optimizar la utilización de recursos. Es necesario evaluar su desempeño en otras poblaciones antes de generalizar su uso. La escala de Zhang-China no logró un buen desempeño al aplicarse a la cohorte. El modelo de Xie-China, aunque prometedor por su desempeño, presenta una herramienta para cálculo de puntajes compleja, vulnerable de error de medición y demandante de recursos, que no la hace apta para su aplicación clínica local.