Modelos de Aprendizaje de Máquina para la detección de crisis epilépticas.

Las señales EEG (Electroencefalografía) constituyen registros de la actividad eléctrica del cerebro, que reflejan la función eléctrica generada por las neuronas. Estas señales desempeñan un papel fundamental en el estudio de diversas funciones cerebrales y el diagnóstico de trastornos neurológicos....

Full description

Autores:
López Rodríguez, Diego Alejandro
Isaza Vides, Saray Andrea
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/66804
Acceso en línea:
http://hdl.handle.net/10554/66804
Palabra clave:
EEG
Actividad cerebral
Electrodos
Anotaciones
Detección de crisis epilépticas
Modelos de Aprendizaje de Máquina
Filtros y características de frecuencia
Clasificadores supervisados
Evaluación de desempeño
EEG
Brain activity
Electrodes
Annotations
Epileptic seizure detection
Machine learning Models
Filters and frequency characteristics
Supervised classifiers
Performance evaluation
Ingeniería electrónica - Tesis y disertaciones académicas
Epilepsia
Inteligencia artificial
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
Description
Summary:Las señales EEG (Electroencefalografía) constituyen registros de la actividad eléctrica del cerebro, que reflejan la función eléctrica generada por las neuronas. Estas señales desempeñan un papel fundamental en el estudio de diversas funciones cerebrales y el diagnóstico de trastornos neurológicos. No obstante, suelen caracterizarse por su tendencia a presentar ruido, lo cual complica significativamente tanto su lectura como su análisis. Esta interferencia en la señal EEG contribuye a la dificultad inherente en la detección de crisis epilépticas, convirtiéndola en una tarea ardua. En el presente trabajo, se utiliza la base de datos 'Seize It1 Dataset', la cual contiene 42 pacientes, de los cuales cada cuenta con un total de grabaciones entre 12 a 22. Así mismo se tiene información de 26 canales correspondientes a la ubicación de los electrodos, de los cuales 19 contienen información de señales electroencefalográficas. Por otra parte cada paciente cuenta con un conjunto de anotaciones, las cuales contienen información sobre el inicio y fin de las crisis en segundos e información adicional sobre el posicionamiento de los electrodos. Con el fin de dar solución a esta difícil tarea, se propone una metodología donde se desarrollan Modelos de Aprendizaje de Máquina que tienen como objetivo la clasificación de patrones de señales EEG con respecto a las clases de crisis y no crisis. Para llevar a cabo este proceso, se extraen las señales de interés de la base de datos y se acondicionan a través de filtros de limpieza de ruido para, posteriormente, obtener características relevantes de cada banda de frecuencia (delta (1-3 Hz), theta (4-7 Hz), alpha (7-12 Hz), beta (12-30 Hz), gamma ( > 30 Hz)) a partir de la estimación de la densidad espectral de potencia por medio del método de Welch. Estas características son utilizadas para construir clasificadores de Aprendizaje Supervisado como Regresión Logística, Máquinas de Soporte Vectorial (SVM) y Arboles de decisión con la capacidad de realizar detecciones de eventos u observaciones con crisis con un buen desempeño de clasificación a partir de un proceso balanceo de clases y validación con respecto a hiperparámetros que se ajustan a los datos de entrada de cada clasificador. Por otra parte, se realiza una propuesta de clasificación por medio del modelo de Regresión Logística la cual se basa en el calculo de los parámetros $\theta$ en donde se busca definir inicialmente el vector perpendicular a la clase de crisis, para luego calcular el hiper- plano que separa tanto la clase de crisis como de no crisis. Esto se realiza a partir de los datos obtenidos en la matriz de características. Finalmente estos modelos son evaluados a partir de métricas de desempeño como la exactitud, precisión, sensibilidad y especificidad, así como su representación por medio de la matriz de confusión. Además, son comparados a partir de diagramas estadísticos que representan la distribución y variabilidad del rendimiento de los modelos con respecto a una métrica.