Dynamic characterization of non-stationary signals using entropy-based relevance analysis

Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por máquinas rotatoria. Es...

Full description

Autores:
López Montes, Juan Camilo
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/76711
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/76711
http://bdigital.unal.edu.co/73414/
Palabra clave:
electroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergence
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_8dd793a60b7a922d07986d573b65f5a1
oai_identifier_str oai:repositorio.unal.edu.co:unal/76711
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Dynamic characterization of non-stationary signals using entropy-based relevance analysis
title Dynamic characterization of non-stationary signals using entropy-based relevance analysis
spellingShingle Dynamic characterization of non-stationary signals using entropy-based relevance analysis
electroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergence
title_short Dynamic characterization of non-stationary signals using entropy-based relevance analysis
title_full Dynamic characterization of non-stationary signals using entropy-based relevance analysis
title_fullStr Dynamic characterization of non-stationary signals using entropy-based relevance analysis
title_full_unstemmed Dynamic characterization of non-stationary signals using entropy-based relevance analysis
title_sort Dynamic characterization of non-stationary signals using entropy-based relevance analysis
dc.creator.fl_str_mv López Montes, Juan Camilo
dc.contributor.author.spa.fl_str_mv López Montes, Juan Camilo
dc.contributor.spa.fl_str_mv Castellanos Domínguez, César Germán
Cardona Morales, Oscar
dc.subject.proposal.spa.fl_str_mv electroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergence
topic electroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergence
description Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por máquinas rotatoria. Es necesario, proponer una etapa de análisis de relevancia que selecciona los componentes más importantes y reduzca el alto costo computacional. Sin embargo, todavía no existe un método estándar para seleccionar componentes relevantes que puede variar de acuerdo con el objeto de estudio, por lo tanto, para desarrollar una metodología precisa, se debe incluir información inherente y tener un entendimiento del problema. En este trabajo, se propone una metodología para revelar patrones relevantes en las dimensiones del espacio, tiempo y frecuencia considerando el escenario del experimento. La propuesta consiste en dos etapas una etapa de extracción de características y una etapa donde se comparan las características guiados por las etiquetas, fue puesta a prueba en las señales de vibraciones y de encefalograma (EEG) enfocado en la tarea de motor imagery (MI). En la tarea de MI la metodología se usa para mejorar el rendimiento de clasificación, el procedimiento consiste en filtrar cada canal en diferentes bandas de frecuencia previamente establecidas para extraer un conjunto de características basado en la entropía, para ser guiadas por una medida de similitud guiada por las etiquetas, finalmente se selecciona el conjunto de componentes que mejor discrimina las clases, las componentes significativas serán en conjunto más pequeño que logre el mejor acierto de clasificación. La propuesta consiste en dos etapas de las cuales pueden ajustarse según la tarea, la etapa de extracción de características que debe ser seleccionado por el tipo de señal, codificando las dinámicas relevantes de la señal, la etapa medida de similitud se selecciona según el tipo de característica y su dimension. En esta tesis probamos dos diferentes configuraciones de las etapas con el fin de mostrar la versatilidad de nuestro método y revelar que configuración codifica mejor las dinámicas relevantes. La primera configuración se basa en caracterizar las bandas filtradas por la entropia de Renyi y entropia Permutation para realizar un test estadístico guiado por las clases sobre estas, revelando el nivel de significancia de cada banda. La segunda configuración caracteriza mediante la construcción un kernel basado en la cross-correlation de cada banda, para posteriormente compararla contra el kernel de etiquetas por CKA obteniendo el valor de relevancia de cada banda y canal. Las metodologías fueron probadas en tres bases de datos de BCI y comparado contra distintos métodos del estado del arte donde nuestro análisis de relevancia mejora estadísticamente la clasificación de las tareas de MI con una menor cantidad de canales y bandas de frecuencia. En las señales de vibraciones se propone un índice de salud basado en un análisis de relevancia que revela el estado actual de la máquina rotativa e identifica de manera temprana fallos en la misma, la propuesta codifica cada registro del sensor por Ordinal Symbolic Dynamical (OSD) y a partir de este se construye una función de densidad de probabilidad (fdp) para el registro actual y un conjunto de registros sanos, finalmente se obtiene un índice de salud comparando estos por la divergencia de Jensen. El orden del OSD debe ser ajustado de manera óptima debido a que este controla la cantidad de símbolos que pueden existir en el diccionario y por lo tanto la cantidad de bins o eventos de la fdp. Este parámetro fue ajustado según el estado del arte y teniendo en cuanto que el orden que es directamente proporcional al costo computacional. En comparación con métodos del estado arte nuestra propuesta logra identificar el inicio de degradación del rodamiento más temprano. En general, el análisis de relevancia permite una reducción considerable de características, esto facilita la interpretación fisiológica de los experimentos y puede mejorar el rendimiento y el costo computacional de los sistemas que utilizan estas características.
publishDate 2019
dc.date.issued.spa.fl_str_mv 2019-07-25
dc.date.accessioned.spa.fl_str_mv 2020-03-30T06:27:05Z
dc.date.available.spa.fl_str_mv 2020-03-30T06:27:05Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/76711
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/73414/
url https://repositorio.unal.edu.co/handle/unal/76711
http://bdigital.unal.edu.co/73414/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales
Sede Manizales
dc.relation.haspart.spa.fl_str_mv 5 Ciencias naturales y matemáticas / Science
51 Matemáticas / Mathematics
52 Astronomía y ciencias afines / Astronomy
6 Tecnología (ciencias aplicadas) / Technology
62 Ingeniería y operaciones afines / Engineering
dc.relation.references.spa.fl_str_mv López Montes, Juan Camilo (2019) Dynamic characterization of non-stationary signals using entropy-based relevance analysis. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/76711/1/1053838857.2019.pdf
https://repositorio.unal.edu.co/bitstream/unal/76711/2/1053838857.2019.pdf.jpg
bitstream.checksum.fl_str_mv fcbbba103e95ae036a904355fdfd399e
c122c35b79ee7c38a0cc42ba3aa00b0f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089413508988928
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Domínguez, César GermánCardona Morales, OscarLópez Montes, Juan Camilo88b8eccf-483f-495e-b0e9-cbf8605eab403002020-03-30T06:27:05Z2020-03-30T06:27:05Z2019-07-25https://repositorio.unal.edu.co/handle/unal/76711http://bdigital.unal.edu.co/73414/Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por máquinas rotatoria. Es necesario, proponer una etapa de análisis de relevancia que selecciona los componentes más importantes y reduzca el alto costo computacional. Sin embargo, todavía no existe un método estándar para seleccionar componentes relevantes que puede variar de acuerdo con el objeto de estudio, por lo tanto, para desarrollar una metodología precisa, se debe incluir información inherente y tener un entendimiento del problema. En este trabajo, se propone una metodología para revelar patrones relevantes en las dimensiones del espacio, tiempo y frecuencia considerando el escenario del experimento. La propuesta consiste en dos etapas una etapa de extracción de características y una etapa donde se comparan las características guiados por las etiquetas, fue puesta a prueba en las señales de vibraciones y de encefalograma (EEG) enfocado en la tarea de motor imagery (MI). En la tarea de MI la metodología se usa para mejorar el rendimiento de clasificación, el procedimiento consiste en filtrar cada canal en diferentes bandas de frecuencia previamente establecidas para extraer un conjunto de características basado en la entropía, para ser guiadas por una medida de similitud guiada por las etiquetas, finalmente se selecciona el conjunto de componentes que mejor discrimina las clases, las componentes significativas serán en conjunto más pequeño que logre el mejor acierto de clasificación. La propuesta consiste en dos etapas de las cuales pueden ajustarse según la tarea, la etapa de extracción de características que debe ser seleccionado por el tipo de señal, codificando las dinámicas relevantes de la señal, la etapa medida de similitud se selecciona según el tipo de característica y su dimension. En esta tesis probamos dos diferentes configuraciones de las etapas con el fin de mostrar la versatilidad de nuestro método y revelar que configuración codifica mejor las dinámicas relevantes. La primera configuración se basa en caracterizar las bandas filtradas por la entropia de Renyi y entropia Permutation para realizar un test estadístico guiado por las clases sobre estas, revelando el nivel de significancia de cada banda. La segunda configuración caracteriza mediante la construcción un kernel basado en la cross-correlation de cada banda, para posteriormente compararla contra el kernel de etiquetas por CKA obteniendo el valor de relevancia de cada banda y canal. Las metodologías fueron probadas en tres bases de datos de BCI y comparado contra distintos métodos del estado del arte donde nuestro análisis de relevancia mejora estadísticamente la clasificación de las tareas de MI con una menor cantidad de canales y bandas de frecuencia. En las señales de vibraciones se propone un índice de salud basado en un análisis de relevancia que revela el estado actual de la máquina rotativa e identifica de manera temprana fallos en la misma, la propuesta codifica cada registro del sensor por Ordinal Symbolic Dynamical (OSD) y a partir de este se construye una función de densidad de probabilidad (fdp) para el registro actual y un conjunto de registros sanos, finalmente se obtiene un índice de salud comparando estos por la divergencia de Jensen. El orden del OSD debe ser ajustado de manera óptima debido a que este controla la cantidad de símbolos que pueden existir en el diccionario y por lo tanto la cantidad de bins o eventos de la fdp. Este parámetro fue ajustado según el estado del arte y teniendo en cuanto que el orden que es directamente proporcional al costo computacional. En comparación con métodos del estado arte nuestra propuesta logra identificar el inicio de degradación del rodamiento más temprano. En general, el análisis de relevancia permite una reducción considerable de características, esto facilita la interpretación fisiológica de los experimentos y puede mejorar el rendimiento y el costo computacional de los sistemas que utilizan estas características.Nowadays deal with data of high dimension, that contain complex signals whose information can be contaminated noise, redundancy or irrelevant information can be a recurring problem in processes such as EEG signals or signs of vibrations produced by machines rotating basis. In order to solve this problem, you can deploy an analysis phase of relevance to select the most important components and reduce the high computational cost. However, there is still no standard method for selecting relevant components that may vary according to the object of study, therefore, in order to develop a precise methodology, inherent information should be included and an understanding of the problem. This thesis proposes three methodologies to reveal relevant patterns in the dimensions of space, time and frequency considering the scenario of the experiment. The proposal consists of two stages the first is the feature extraction stage and the second stage is where the characteristics guided by the labels are compared, the methodology which was tested in the vibration and EEG signals, focused on the Motor imagery task (MI). In the MI task the methodology is used to improve the performance of classification in tasks of Brain Computer Interface (BCI), the procedure is to filter each channel in different bands to extract a set of characteristics based on the entropy, subsequently, the characteristics of class one against class two are compared by a measure of dissimilarity, in order to select the set of components that best discriminates the classes, finally, the significant components will be smaller together that achieves the best classification success. The proposal consists of two stages of which can be adjusted according to the task, first the method of extraction of characteristics which must be selected by the type of signal, the type of extraction selected must be able to codify the relevant dynamics of the signal, second the measure of similarity is selected according to the type of features and its dimension. In this document we tested two different stage configurations in order to show the versatility of our method and reveal which configuration better encodes relevant dynamics. The first configuration is based on characterizing the bands filtered by the entropy of Renyi and Ordinal symbolic Dynamics to perform a statistical test guided by the classes on these revealing the level of significance of each band. The second configuration characterized by building a kernel based on the cross-correlation of each band, comparing the array built against the kernel of labels per CKA getting the value relevance of each band and channel. For MI task our methodology was tested in three different BCI datasets and compared against different methods of the state of the art where our relevance analysis statistically improves the classification of MI tasks with a lesser amount of channels and frequency bands. For vibration signals, the condition of the machine must be evaluated by a health index reveals the current state of the rotary machine and identifies early failures in it, first encodes each sensor record by Ordinal Symbolic Dynamical (OSD ) and is built a probability density function (FDP) based on the coding, to be compared against sound records by the Jensen divergence. The order of the OSD must be adjusted optimally because it controls the number of symbols that can exist in the dictionary and therefore the quantity of bins or events of the FDP. This parameter was adjusted according to the state of the art and taking in as far as the order that is directly proportional to the computational cost. In comparison with state methods art our proposed approach succeeds in identifying the start of degradation of bearing more early. In general, the relevance analysis allows a considerable reduction of characteristics, this facilitates the physiological interpretation of the experiments and can improve the performance and the computational cost of the systems that use these characteristics.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede ManizalesSede Manizales5 Ciencias naturales y matemáticas / Science51 Matemáticas / Mathematics52 Astronomía y ciencias afines / Astronomy6 Tecnología (ciencias aplicadas) / Technology62 Ingeniería y operaciones afines / EngineeringLópez Montes, Juan Camilo (2019) Dynamic characterization of non-stationary signals using entropy-based relevance analysis. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.Dynamic characterization of non-stationary signals using entropy-based relevance analysisTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMelectroencephalogram, Brain-Computer Interface, Permutation Entropy, Renyi Entropy, Health index, Rolling element bearing, Jensen divergenceORIGINAL1053838857.2019.pdfTesis de Maestría en Ingeniería - Automatización Industrialapplication/pdf618098https://repositorio.unal.edu.co/bitstream/unal/76711/1/1053838857.2019.pdffcbbba103e95ae036a904355fdfd399eMD51THUMBNAIL1053838857.2019.pdf.jpg1053838857.2019.pdf.jpgGenerated Thumbnailimage/jpeg4308https://repositorio.unal.edu.co/bitstream/unal/76711/2/1053838857.2019.pdf.jpgc122c35b79ee7c38a0cc42ba3aa00b0fMD52unal/76711oai:repositorio.unal.edu.co:unal/767112024-09-16 15:09:52.525Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co