Interpretabilidad de un modelo basado en aprendizaje profundo para el diagnóstico de retinopatía diabética

En este documento se presenta el desarrollo de una red neuronal convolucional profunda para la clasificación de imágenes de retina con retinopatía diabética y la implementación de mapas de activaciones de clase ponderados por gradientes (Grad-CAM) a los resultados obtenidos por el modelo. El modelo...

Full description

Autores:
Torres Revelo, Isabella
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad Autónoma de Occidente
Repositorio:
RED: Repositorio Educativo Digital UAO
Idioma:
spa
OAI Identifier:
oai:red.uao.edu.co:10614/12751
Acceso en línea:
http://red.uao.edu.co//handle/10614/12751
Palabra clave:
Ingeniería Biomédica
Retinopatía diabética
Redes neuronales convolucionales
Interpretabilidad
Técnicas de explicación
Grad-CAM
Mapas de activación de clase
Deep learning
Redes neurales (Computadores)
Imágenes diagnósticas-Técnicas digitales
Artificial intelligence
Neural networks (Computer science)
Diagnostic imaging-Digital techniques
Rights
openAccess
License
Derechos Reservados - Universidad Autónoma de Occidente
Description
Summary:En este documento se presenta el desarrollo de una red neuronal convolucional profunda para la clasificación de imágenes de retina con retinopatía diabética y la implementación de mapas de activaciones de clase ponderados por gradientes (Grad-CAM) a los resultados obtenidos por el modelo. El modelo fue entrenado con un conjunto de imágenes de retina (aproximadamente 88.000) de alta resolución tomadas bajo diferentes condiciones de captura. Las imágenes fueron sometidas a un preprocesamiento con el objetivo de homogeneizar su tamaño y color. Además, fueron etiquetadas por expertos médicos con los cinco niveles de severidad de la enfermedad. El desempeño de la red neuronal fue evaluado por medio del cálculo de métricas estadísticas obtenidas de la matriz de confusión y con la métrica Kappa. Con esta última se obtuvo un porcentaje de acuerdo de 77% para los datos de prueba entre la clasificación dada por el modelo y la de los expertos médicos. También, con la matriz de confusión se identificaron los errores de tipo I y II cometidos por la red neuronal. Grad-CAM es una técnica de explicación que aporta información sobre las representaciones internas de los modelos de aprendizaje profundo. La aplicación de esta técnica en las imágenes de la retina resaltó regiones donde se encuentran lesiones características de la enfermedad con un mapa de calor. Estos resultados permitieron conocer los patrones y características que la red neuronal aprendió a reconocer y se comprendieron las razones por las cuales la red neuronal clasifica una imagen en un nivel de severidad determinado. Así mismo, facilitó el reconocimiento de falsos positivos y negativos en los resultados de la clasificación permitiendo que se desarrollen alternativas y mejoras al modelo de red neuronal para aumentar su desempeño y su capacidad de reconocimiento