Herramienta software para identificación automática de acento local

Las variaciones en los acentos es uno de los factores que más afecta el rendimiento de los sistemas de reconocimiento de voz. En Colombia, a pesar de existir una diversidad de acentos, no se ha realizado una evaluación formal de los métodos actuales para identificación automática de este, los cuales...

Full description

Autores:: Correa Neira, Tania Liseth
Bolivar Acosta, Yorlene

Tipo de recurso:

Fecha de publicación:: 2016

Institución:: Universidad del Norte

Repositorio:: Repositorio Uninorte

Idioma:: spa

id	REPOUNORT2_d4200881b22061513db4f805f0edf870
oai_identifier_str	oai:manglar.uninorte.edu.co:10584/5892
network_acronym_str	REPOUNORT2
network_name_str	Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv	Herramienta software para identificación automática de acento local
dc.title.en_US.fl_str_mv	Software tool for local accent automatic identification
title	Herramienta software para identificación automática de acento local
spellingShingle	Herramienta software para identificación automática de acento local Acento Colombia, GMM, LPCC, MFCC, reconocimiento de voz Colombian accent, GMM, LPCC, MFCC, speech recognition
title_short	Herramienta software para identificación automática de acento local
title_full	Herramienta software para identificación automática de acento local
title_fullStr	Herramienta software para identificación automática de acento local
title_full_unstemmed	Herramienta software para identificación automática de acento local
title_sort	Herramienta software para identificación automática de acento local
dc.creator.fl_str_mv	Correa Neira, Tania Liseth Bolivar Acosta, Yorlene
dc.contributor.advisor.none.fl_str_mv	Percybooks Bolivar, Winston Spencer
dc.contributor.author.none.fl_str_mv	Correa Neira, Tania Liseth Bolivar Acosta, Yorlene
dc.subject.es_ES.fl_str_mv	Acento Colombia, GMM, LPCC, MFCC, reconocimiento de voz
topic	Acento Colombia, GMM, LPCC, MFCC, reconocimiento de voz Colombian accent, GMM, LPCC, MFCC, speech recognition
dc.subject.en_US.fl_str_mv	Colombian accent, GMM, LPCC, MFCC, speech recognition
description	Las variaciones en los acentos es uno de los factores que más afecta el rendimiento de los sistemas de reconocimiento de voz. En Colombia, a pesar de existir una diversidad de acentos, no se ha realizado una evaluación formal de los métodos actuales para identificación automática de este, los cuales se centran en el idioma inglés. Se propone la implementación de una herramienta que permite identificar cuando un audio o alguna frase leída por el usuario, pertenece o no al acento local de la costa atlántica colombiana. Inicialmente, fue necesario crear una base de datos con voluntarios de acento de la costa atlántica y de otras regiones del país. Esta consiste en 13 personas de acento local y 6 personas de acento no local. El desarrollo del software consistió de 2 etapas: una de entrenamiento y una de pruebas. En la primera etapa se extrajeron los vectores de características Mel Frequency Cepstral Coefficients(MFCC) y Linear Prediction Cepstral Coefficientes(LPCC) de una determinada cantidad de frases de la base de datos. Luego de esto, se produjeron los modelos de Gaussian Mixture Model(GMM) para las frases de ambos acentos; La segunda etapa(prueba) consistió en determinar qué tan preciso son los métodos implementados en el software para el reconocimiento del acento local: LPCC-GMM y MFCC-GMM y cuál de los dos es el mejor para la identificación del acento costeño local. Por cada frase que se introduce al software se toma una decisión: posee o no acento local. Por ello, cada frase constituye una muestra. Para realizar la prueba de hipótesis se tomaron 50 muestras, escogiendo aleatoriamente 5 personas de acento local y 5 personas con acento no local de los audios destinados a pruebas. Se evidenció con un nivel de confianza del 95% que el rendimiento para LPCC-GMM está entre un 64.16% y 87.84%, y para MFCC-GMM está entre 40.19% y 67.81%. Con esto se concluye que entre estos dos métodos LPCC-GMM es el más idóneo para ser utilizado en nuestro sistema.
publishDate	2016
dc.date.issued.none.fl_str_mv	2016-11-24
dc.date.accessioned.none.fl_str_mv	2017-02-13T20:02:57Z
dc.date.available.none.fl_str_mv	2017-02-13T20:02:57Z
dc.type.es_ES.fl_str_mv	article
dc.type.coar.fl_str_mv	http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv	http://hdl.handle.net/10584/5892
url	http://hdl.handle.net/10584/5892
dc.language.iso.es_ES.fl_str_mv	spa
language	spa
dc.rights.es_ES.fl_str_mv	Universidad del Norte
dc.rights.coar.fl_str_mv	http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv	Universidad del Norte http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv	Barranquilla, Universidad del Norte, 2016
institution	Universidad del Norte
bitstream.url.fl_str_mv	http://172.16.14.36:8080/bitstream/10584/5892/1/pf.png http://172.16.14.36:8080/bitstream/10584/5892/2/pf.pdf http://172.16.14.36:8080/bitstream/10584/5892/3/license.txt
bitstream.checksum.fl_str_mv	9ce78bf1560f4fbbe0a4e0aaf19bb349 02688208372d87861c485cddc30845d4 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv	mauribe@uninorte.edu.co
_version_	1849968527142813696
spelling	Percybooks Bolivar, Winston SpencerCorrea Neira, Tania LisethBolivar Acosta, Yorlene2017-02-13T20:02:57Z2017-02-13T20:02:57Z2016-11-24http://hdl.handle.net/10584/5892Las variaciones en los acentos es uno de los factores que más afecta el rendimiento de los sistemas de reconocimiento de voz. En Colombia, a pesar de existir una diversidad de acentos, no se ha realizado una evaluación formal de los métodos actuales para identificación automática de este, los cuales se centran en el idioma inglés. Se propone la implementación de una herramienta que permite identificar cuando un audio o alguna frase leída por el usuario, pertenece o no al acento local de la costa atlántica colombiana. Inicialmente, fue necesario crear una base de datos con voluntarios de acento de la costa atlántica y de otras regiones del país. Esta consiste en 13 personas de acento local y 6 personas de acento no local. El desarrollo del software consistió de 2 etapas: una de entrenamiento y una de pruebas. En la primera etapa se extrajeron los vectores de características Mel Frequency Cepstral Coefficients(MFCC) y Linear Prediction Cepstral Coefficientes(LPCC) de una determinada cantidad de frases de la base de datos. Luego de esto, se produjeron los modelos de Gaussian Mixture Model(GMM) para las frases de ambos acentos; La segunda etapa(prueba) consistió en determinar qué tan preciso son los métodos implementados en el software para el reconocimiento del acento local: LPCC-GMM y MFCC-GMM y cuál de los dos es el mejor para la identificación del acento costeño local. Por cada frase que se introduce al software se toma una decisión: posee o no acento local. Por ello, cada frase constituye una muestra. Para realizar la prueba de hipótesis se tomaron 50 muestras, escogiendo aleatoriamente 5 personas de acento local y 5 personas con acento no local de los audios destinados a pruebas. Se evidenció con un nivel de confianza del 95% que el rendimiento para LPCC-GMM está entre un 64.16% y 87.84%, y para MFCC-GMM está entre 40.19% y 67.81%. Con esto se concluye que entre estos dos métodos LPCC-GMM es el más idóneo para ser utilizado en nuestro sistema.The variations in the accents is one of the factors that affects the most the performance of the speech recognition systems. In Colombia, even though there is a great accents diversity, it has not been carried out a formal evaluation regarding the current methods for the accent automatic identification. It is proposed the implementation of a tool, which allows to identify whether a recording belongs to the local accent from the Colombian atlantic coast. Firstly, it was necessary to creat a database with volunteers who had the accent from the Colombian atlantic coast and from other regions of the country. This database contains recordings from 13 volunteers with local accent and 6 with no local accent. The software development had 2 phases: training and testing. During the first phase, it was extracted the Mel Frequency Cepstral Coefficients(MFCC) and Linear Prediction Cepstral Coefficients(LPCC) vectors from a determined amount of phrases belonging to the database. Then, it was build the Gaussian Mixture Models (GMM) for the phrases of both accents; during the second phase it was calculated the accuracy levels of both methods: LPCC-GMM and MFCC-GMM in order to determine which of them was the best for the Atlantic coast accent. Each sentence of input to the software, this makes a decision: whether it has the local accent or it does not. For testing, it was taken 50 samples, choosing randomly recordings of 5 people from local accent and 5 people from no local accent. It was found that with a confidence level of 95%, the accuracy for LPCC-GMM was between 64.16% and 87.84% and for MFCC-GMM it was between 40.19% and 67.81%. In conclusion, between the two implemented methods, LPCC-GMM is the best choice for our system.spaBarranquilla, Universidad del Norte, 2016Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Acento Colombia, GMM, LPCC, MFCC, reconocimiento de vozColombian accent, GMM, LPCC, MFCC, speech recognitionHerramienta software para identificación automática de acento localSoftware tool for local accent automatic identificationarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALpf.pngpf.pngimage/png343293http://172.16.14.36:8080/bitstream/10584/5892/1/pf.png9ce78bf1560f4fbbe0a4e0aaf19bb349MD51pf.pdfpf.pdfapplication/pdf156793http://172.16.14.36:8080/bitstream/10584/5892/2/pf.pdf02688208372d87861c485cddc30845d4MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://172.16.14.36:8080/bitstream/10584/5892/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/5892oai:172.16.14.36:10584/58922017-02-13 15:02:57.994Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.co

Herramienta software para identificación automática de acento local

Publicaciones similares