Modelo de identificación de locutor en entornos GSM, aplicación en Colombia

Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente,...

Garavito Neira, Elkin Ramón
Universidad Nacional de Colombia
38 Comercio, comunicaciones, transporte / Commerce, communications and transportation
62 Ingeniería y operaciones afines / Engineering
Reconocimiento de voz
Procesamiento de señales
Coeficientes cepstrales de frecuencia MEL
Coefficientes Cepstrales de predicción lineal
Transformada discreta de Wavelet
Voice recognition Signal Processing
Mel Frequency Cepstral Coefficients
Linear Predicting Coding Coefficients
Discrete Wavelet Transform
Atribución-NoComercial 4.0 Internacional
Summary:Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente, los algoritmos planteados no arrojan niveles satisfactorios de éxito cuando se aplican sobre registros de voz que se han obtenido a partir de teléfonos celulares. Aquí se propone un modelo que arroje una tasa de éxito satisfactoria, aplicada a los registros de voz tomados a través de teléfonos celulares en Colombia, y así abrir un amplio espectro de aplicaciones interesantes que van desde la posibilidad de hacer entrevistas de trabajo a través del teléfono celular, hasta hacer compras o transacciones bancarias; además, consultar los mensajes del contestador a través del celular, identificar a los locutores que hablan en una conversación interceptada con fines delincuenciales, con el objeto de procesar a los culpables, etc. Todo ello sin utilizar claves que usualmente son robadas u olvidadas, ni tarjetas que se puedan perder. La voz convertida en un elemento de identificación inequívoca, como las huellas digitales, y soportado sobre la tecnología celular más difundida en el mundo (GSM) se convierte en una prometedora técnica de gran impacto. Este documento muestra los resultados de un arduo trabajo en la búsqueda de este objetivo, y las conclusiones que se pudieron obtener. / Abstract. A voice recognition system is a system that recognizes a person who is speaking, given his or her voice registry. Nevertheless, all the developments that are found in the databases of papers, libraries and internet researchers, are always warning us about the same inconvenient, the given algorithms don´t throw statistic levels of success when those are applied over voice registries that have been obtained from cellular phones. The purpose of this work, is to propose a model that gives a satisfying success rate applied to voice registries taken through cellular phones in Colombia, and in this way open a interesting and new applications spectrum, that come from doing work interviews through the cellular phone until doing shopping o big bank transactions; form consulting the voice messages in the answering machine through the cell phone, until identify the speaker that talk in an intercepted communication in a law apprehension effort. All of this without the using of keys that can be stolen or forgotten, neither cards that can be lost. The voice would become an element of identification without errors, such as fingerprints, and supported in the most well known cellular technology in the world (GSM), with all these elements, this becomes a promising technology of great impact. This document pretends to show the results of the hard work in pursue for that objective, and the conclusions that could have got.