Herramienta software para identificación automática de acento local

Las variaciones en los acentos es uno de los factores que más afecta el rendimiento de los sistemas de reconocimiento de voz. En Colombia, a pesar de existir una diversidad de acentos, no se ha realizado una evaluación formal de los métodos actuales para identificación automática de este, los cuales...

Full description

Autores:
Correa Neira, Tania Liseth
Bolivar Acosta, Yorlene
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/5892
Acceso en línea:
http://hdl.handle.net/10584/5892
Palabra clave:
Acento Colombia, GMM, LPCC, MFCC, reconocimiento de voz
Colombian accent, GMM, LPCC, MFCC, speech recognition
Rights
License
Universidad del Norte
Description
Summary:Las variaciones en los acentos es uno de los factores que más afecta el rendimiento de los sistemas de reconocimiento de voz. En Colombia, a pesar de existir una diversidad de acentos, no se ha realizado una evaluación formal de los métodos actuales para identificación automática de este, los cuales se centran en el idioma inglés. Se propone la implementación de una herramienta que permite identificar cuando un audio o alguna frase leída por el usuario, pertenece o no al acento local de la costa atlántica colombiana. Inicialmente, fue necesario crear una base de datos con voluntarios de acento de la costa atlántica y de otras regiones del país. Esta consiste en 13 personas de acento local y 6 personas de acento no local. El desarrollo del software consistió de 2 etapas: una de entrenamiento y una de pruebas. En la primera etapa se extrajeron los vectores de características Mel Frequency Cepstral Coefficients(MFCC) y Linear Prediction Cepstral Coefficientes(LPCC) de una determinada cantidad de frases de la base de datos. Luego de esto, se produjeron los modelos de Gaussian Mixture Model(GMM) para las frases de ambos acentos; La segunda etapa(prueba) consistió en determinar qué tan preciso son los métodos implementados en el software para el reconocimiento del acento local: LPCC-GMM y MFCC-GMM y cuál de los dos es el mejor para la identificación del acento costeño local. Por cada frase que se introduce al software se toma una decisión: posee o no acento local. Por ello, cada frase constituye una muestra. Para realizar la prueba de hipótesis se tomaron 50 muestras, escogiendo aleatoriamente 5 personas de acento local y 5 personas con acento no local de los audios destinados a pruebas. Se evidenció con un nivel de confianza del 95% que el rendimiento para LPCC-GMM está entre un 64.16% y 87.84%, y para MFCC-GMM está entre 40.19% y 67.81%. Con esto se concluye que entre estos dos métodos LPCC-GMM es el más idóneo para ser utilizado en nuestro sistema.