Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo

En esta tesis se presenta una metodología orientada a mejorar la identiﬁcación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas especíﬁcas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimie...

Full description

Autores:: Sarria Paja, Milton Orlando

Tipo de recurso:

Fecha de publicación:: 2009

Institución:: Universidad Nacional de Colombia

Repositorio:: Universidad Nacional de Colombia

Idioma:: spa

Description
Summary:	En esta tesis se presenta una metodología orientada a mejorar la identiﬁcación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas especíﬁcas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimiento de patrones. Para clasiﬁcar datos que se desarrollan a lo largo de un argumento como el tiempo entre otras técnicas, es de amplio conocimiento el uso de modelos ocultos de Markov. Al emplear un sistema de clasiﬁcación basado en modelos ocultos de Markov, necesariamente se debe resolver el problema de entrenamiento, que implica el ajuste de los parámetros del modelo mediante la optimización de una función objetivo. La forma y características de dicha función viene determinado por el criterio de entrenamiento que puede ser generativo o discriminativo, donde las técnicas de entrenamiento discriminativo se consideran mucho más adecuadas en la solución de problemas como el que se ha puesto en consideración. Por lo tanto abordando la ﬁlosofía de entrenamiento discriminativo se propone emplear un criterio de entrenamiento que no solo esté enfocado minimizar la probabilidad del error o generar fronteras de decisión adecuadas, si no también en la optimización de una medida de desempeño mucho más general que el error de clasiﬁcación, para tal ﬁn se sugiere el empleo de una función de costo que se relacione indirectamente con el área que encierra una curva de desempeño mediante una distancia entre modelos de clases. En particular se propone emplear la distancia de Mahalanobis como función objetivo, y como medida de desempeño el area de la curva ROC, complementando esto con una técnica de selección y/o extracción de características relativamente simple. Los resultados experimentales se presentan sobre dos bases de datos de patologías de voz y muestran que la metodología propuesta permite mejorar el desempeño de un sistema de clasiﬁcación, incluso cuando la dimensión del espacio de entrenamiento se ha reducido signiﬁcativamente.

Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo

Publicaciones similares