Dynamic characterization of non-stationary signals using entropy-based relevance analysis
Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por máquinas rotatoria. Es...
- Autores:
-
López Montes, Juan Camilo
- Tipo de recurso:
- Fecha de publicación:
- 2019
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/76711
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/76711
http://bdigital.unal.edu.co/73414/
- Palabra clave:
- electroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergence
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por máquinas rotatoria. Es necesario, proponer una etapa de análisis de relevancia que selecciona los componentes más importantes y reduzca el alto costo computacional. Sin embargo, todavía no existe un método estándar para seleccionar componentes relevantes que puede variar de acuerdo con el objeto de estudio, por lo tanto, para desarrollar una metodología precisa, se debe incluir información inherente y tener un entendimiento del problema. En este trabajo, se propone una metodología para revelar patrones relevantes en las dimensiones del espacio, tiempo y frecuencia considerando el escenario del experimento. La propuesta consiste en dos etapas una etapa de extracción de características y una etapa donde se comparan las características guiados por las etiquetas, fue puesta a prueba en las señales de vibraciones y de encefalograma (EEG) enfocado en la tarea de motor imagery (MI). En la tarea de MI la metodología se usa para mejorar el rendimiento de clasificación, el procedimiento consiste en filtrar cada canal en diferentes bandas de frecuencia previamente establecidas para extraer un conjunto de características basado en la entropía, para ser guiadas por una medida de similitud guiada por las etiquetas, finalmente se selecciona el conjunto de componentes que mejor discrimina las clases, las componentes significativas serán en conjunto más pequeño que logre el mejor acierto de clasificación. La propuesta consiste en dos etapas de las cuales pueden ajustarse según la tarea, la etapa de extracción de características que debe ser seleccionado por el tipo de señal, codificando las dinámicas relevantes de la señal, la etapa medida de similitud se selecciona según el tipo de característica y su dimension. En esta tesis probamos dos diferentes configuraciones de las etapas con el fin de mostrar la versatilidad de nuestro método y revelar que configuración codifica mejor las dinámicas relevantes. La primera configuración se basa en caracterizar las bandas filtradas por la entropia de Renyi y entropia Permutation para realizar un test estadístico guiado por las clases sobre estas, revelando el nivel de significancia de cada banda. La segunda configuración caracteriza mediante la construcción un kernel basado en la cross-correlation de cada banda, para posteriormente compararla contra el kernel de etiquetas por CKA obteniendo el valor de relevancia de cada banda y canal. Las metodologías fueron probadas en tres bases de datos de BCI y comparado contra distintos métodos del estado del arte donde nuestro análisis de relevancia mejora estadísticamente la clasificación de las tareas de MI con una menor cantidad de canales y bandas de frecuencia. En las señales de vibraciones se propone un índice de salud basado en un análisis de relevancia que revela el estado actual de la máquina rotativa e identifica de manera temprana fallos en la misma, la propuesta codifica cada registro del sensor por Ordinal Symbolic Dynamical (OSD) y a partir de este se construye una función de densidad de probabilidad (fdp) para el registro actual y un conjunto de registros sanos, finalmente se obtiene un índice de salud comparando estos por la divergencia de Jensen. El orden del OSD debe ser ajustado de manera óptima debido a que este controla la cantidad de símbolos que pueden existir en el diccionario y por lo tanto la cantidad de bins o eventos de la fdp. Este parámetro fue ajustado según el estado del arte y teniendo en cuanto que el orden que es directamente proporcional al costo computacional. En comparación con métodos del estado arte nuestra propuesta logra identificar el inicio de degradación del rodamiento más temprano. En general, el análisis de relevancia permite una reducción considerable de características, esto facilita la interpretación fisiológica de los experimentos y puede mejorar el rendimiento y el costo computacional de los sistemas que utilizan estas características. |
---|