Development of an isolated, speaker-independent word recognition model using the Hidden Markov toolkit for a java application

"Se crea un modelo de reconocimiento de los números del 1 al 10 en español mediante la herramienta Hidden Markov Toolkit (HTK). La muestra tomada son 10 personas, 5 mujeres y 5 hombres, repitiendo cada número 5 veces, para un total de 50 muestras por número. Usa los Mel frequency Cepstral Coeff...

Full description

Autores:
Farfán Barrero, Diego
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2017
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/61614
Acceso en línea:
http://hdl.handle.net/1992/61614
Palabra clave:
Lingèuística computacional
Procesos de Markov
Reconocimiento automático de la voz
Sistemas de procesamiento de la voz
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:"Se crea un modelo de reconocimiento de los números del 1 al 10 en español mediante la herramienta Hidden Markov Toolkit (HTK). La muestra tomada son 10 personas, 5 mujeres y 5 hombres, repitiendo cada número 5 veces, para un total de 50 muestras por número. Usa los Mel frequency Cepstral Coefficients (MFCC) para extraer las características de la voz y los modelos ocultos de Markov (HMM) para modelar la información. El modelo luego es implementado en una aplicación nativa en Java la cual consiste en un juego de trivia a la que se debe contestar por voz. Se realizaron 2 pruebas, 1 en grabación aislada y otra interactuando con la aplicación. Los resultados fueron positivos con promedio de acierto de 73% y 83% para las 2 pruebas." -- Tomado del Formato de Documento de Grado.