Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo
En esta tesis se presenta una metodología orientada a mejorar la identificación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas específicas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimie...
- Autores:
-
Sarria Paja, Milton Orlando
- Tipo de recurso:
- Fecha de publicación:
- 2009
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/69961
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/69961
http://bdigital.unal.edu.co/2089/
- Palabra clave:
- 62 Ingeniería y operaciones afines / Engineering
Reconocimiento automático de la voz
Reconocimiento de modelos
Procesos de Markov.
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | En esta tesis se presenta una metodología orientada a mejorar la identificación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas específicas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimiento de patrones. Para clasificar datos que se desarrollan a lo largo de un argumento como el tiempo entre otras técnicas, es de amplio conocimiento el uso de modelos ocultos de Markov. Al emplear un sistema de clasificación basado en modelos ocultos de Markov, necesariamente se debe resolver el problema de entrenamiento, que implica el ajuste de los parámetros del modelo mediante la optimización de una función objetivo. La forma y características de dicha función viene determinado por el criterio de entrenamiento que puede ser generativo o discriminativo, donde las técnicas de entrenamiento discriminativo se consideran mucho más adecuadas en la solución de problemas como el que se ha puesto en consideración. Por lo tanto abordando la filosofía de entrenamiento discriminativo se propone emplear un criterio de entrenamiento que no solo esté enfocado minimizar la probabilidad del error o generar fronteras de decisión adecuadas, si no también en la optimización de una medida de desempeño mucho más general que el error de clasificación, para tal fin se sugiere el empleo de una función de costo que se relacione indirectamente con el área que encierra una curva de desempeño mediante una distancia entre modelos de clases. En particular se propone emplear la distancia de Mahalanobis como función objetivo, y como medida de desempeño el area de la curva ROC, complementando esto con una técnica de selección y/o extracción de características relativamente simple. Los resultados experimentales se presentan sobre dos bases de datos de patologías de voz y muestran que la metodología propuesta permite mejorar el desempeño de un sistema de clasificación, incluso cuando la dimensión del espacio de entrenamiento se ha reducido significativamente. |
---|