Modelo de identificación de locutor en entornos GSM, aplicación en Colombia
Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente,...
- Autores:
-
Garavito Neira, Elkin Ramón
- Tipo de recurso:
- Fecha de publicación:
- 2010
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/6896
- Palabra clave:
- 38 Comercio, comunicaciones, transporte / Commerce, communications and transportation
62 Ingeniería y operaciones afines / Engineering
Reconocimiento de voz
Procesamiento de señales
MFCC
Coeficientes cepstrales de frecuencia MEL
LPCC
Coefficientes Cepstrales de predicción lineal
DWT
Transformada discreta de Wavelet
Voice recognition Signal Processing
MFCC
Mel Frequency Cepstral Coefficients
LPCC
Linear Predicting Coding Coefficients
DWT
Discrete Wavelet Transform
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_547ffda48567f0f50f28c1f793ca20f5 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/6896 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
dc.title.translated.Spa.fl_str_mv |
Speaker recognition in GSM environments, application in Colombia |
title |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
spellingShingle |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia 38 Comercio, comunicaciones, transporte / Commerce, communications and transportation 62 Ingeniería y operaciones afines / Engineering Reconocimiento de voz Procesamiento de señales MFCC Coeficientes cepstrales de frecuencia MEL LPCC Coefficientes Cepstrales de predicción lineal DWT Transformada discreta de Wavelet Voice recognition Signal Processing MFCC Mel Frequency Cepstral Coefficients LPCC Linear Predicting Coding Coefficients DWT Discrete Wavelet Transform |
title_short |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
title_full |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
title_fullStr |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
title_full_unstemmed |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
title_sort |
Modelo de identificación de locutor en entornos GSM, aplicación en Colombia |
dc.creator.fl_str_mv |
Garavito Neira, Elkin Ramón |
dc.contributor.advisor.spa.fl_str_mv |
Rojas Camacho, Oswaldo (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Garavito Neira, Elkin Ramón |
dc.subject.ddc.spa.fl_str_mv |
38 Comercio, comunicaciones, transporte / Commerce, communications and transportation 62 Ingeniería y operaciones afines / Engineering |
topic |
38 Comercio, comunicaciones, transporte / Commerce, communications and transportation 62 Ingeniería y operaciones afines / Engineering Reconocimiento de voz Procesamiento de señales MFCC Coeficientes cepstrales de frecuencia MEL LPCC Coefficientes Cepstrales de predicción lineal DWT Transformada discreta de Wavelet Voice recognition Signal Processing MFCC Mel Frequency Cepstral Coefficients LPCC Linear Predicting Coding Coefficients DWT Discrete Wavelet Transform |
dc.subject.proposal.spa.fl_str_mv |
Reconocimiento de voz Procesamiento de señales MFCC Coeficientes cepstrales de frecuencia MEL LPCC Coefficientes Cepstrales de predicción lineal DWT Transformada discreta de Wavelet Voice recognition Signal Processing MFCC Mel Frequency Cepstral Coefficients LPCC Linear Predicting Coding Coefficients DWT Discrete Wavelet Transform |
description |
Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente, los algoritmos planteados no arrojan niveles satisfactorios de éxito cuando se aplican sobre registros de voz que se han obtenido a partir de teléfonos celulares. Aquí se propone un modelo que arroje una tasa de éxito satisfactoria, aplicada a los registros de voz tomados a través de teléfonos celulares en Colombia, y así abrir un amplio espectro de aplicaciones interesantes que van desde la posibilidad de hacer entrevistas de trabajo a través del teléfono celular, hasta hacer compras o transacciones bancarias; además, consultar los mensajes del contestador a través del celular, identificar a los locutores que hablan en una conversación interceptada con fines delincuenciales, con el objeto de procesar a los culpables, etc. Todo ello sin utilizar claves que usualmente son robadas u olvidadas, ni tarjetas que se puedan perder. La voz convertida en un elemento de identificación inequívoca, como las huellas digitales, y soportado sobre la tecnología celular más difundida en el mundo (GSM) se convierte en una prometedora técnica de gran impacto. Este documento muestra los resultados de un arduo trabajo en la búsqueda de este objetivo, y las conclusiones que se pudieron obtener. / Abstract. A voice recognition system is a system that recognizes a person who is speaking, given his or her voice registry. Nevertheless, all the developments that are found in the databases of papers, libraries and internet researchers, are always warning us about the same inconvenient, the given algorithms don´t throw statistic levels of success when those are applied over voice registries that have been obtained from cellular phones. The purpose of this work, is to propose a model that gives a satisfying success rate applied to voice registries taken through cellular phones in Colombia, and in this way open a interesting and new applications spectrum, that come from doing work interviews through the cellular phone until doing shopping o big bank transactions; form consulting the voice messages in the answering machine through the cell phone, until identify the speaker that talk in an intercepted communication in a law apprehension effort. All of this without the using of keys that can be stolen or forgotten, neither cards that can be lost. The voice would become an element of identification without errors, such as fingerprints, and supported in the most well known cellular technology in the world (GSM), with all these elements, this becomes a promising technology of great impact. This document pretends to show the results of the hard work in pursue for that objective, and the conclusions that could have got. |
publishDate |
2010 |
dc.date.issued.spa.fl_str_mv |
2010 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T16:26:40Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T16:26:40Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/6896 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/3149/ |
url |
https://repositorio.unal.edu.co/handle/unal/6896 http://bdigital.unal.edu.co/3149/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Departamento de Ingeniería de Sistemas e Industrial |
dc.relation.references.spa.fl_str_mv |
Garavito Neira, Elkin Ramón (2010) Modelo de identificación de locutor en entornos GSM, aplicación en Colombia / Speaker recognition in GSM environments, application in Colombia. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/6896/1/299634.2010.pdf https://repositorio.unal.edu.co/bitstream/unal/6896/2/299634.2010.pdf.jpg |
bitstream.checksum.fl_str_mv |
d217de5b97ee1a1240811336bca38ef2 3f1502f0de6005f287e4a6068f0fc04e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089212462366720 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Rojas Camacho, Oswaldo (Thesis advisor)7cb8b813-535f-4ed7-925d-acd8176fc40aGaravito Neira, Elkin Ramónbb63f1a3-c250-48a2-92ef-7952f974d17e3002019-06-24T16:26:40Z2019-06-24T16:26:40Z2010https://repositorio.unal.edu.co/handle/unal/6896http://bdigital.unal.edu.co/3149/Un sistema de reconocimiento de voz es un medio que reconoce a la persona que está hablando a partir de su registro de voz. Sin embargo todos los desarrollos que se encuentran en las bases de datos de investigaciones, bibliotecas y buscadores de internet, nos advierten sobre el mismo inconveniente, los algoritmos planteados no arrojan niveles satisfactorios de éxito cuando se aplican sobre registros de voz que se han obtenido a partir de teléfonos celulares. Aquí se propone un modelo que arroje una tasa de éxito satisfactoria, aplicada a los registros de voz tomados a través de teléfonos celulares en Colombia, y así abrir un amplio espectro de aplicaciones interesantes que van desde la posibilidad de hacer entrevistas de trabajo a través del teléfono celular, hasta hacer compras o transacciones bancarias; además, consultar los mensajes del contestador a través del celular, identificar a los locutores que hablan en una conversación interceptada con fines delincuenciales, con el objeto de procesar a los culpables, etc. Todo ello sin utilizar claves que usualmente son robadas u olvidadas, ni tarjetas que se puedan perder. La voz convertida en un elemento de identificación inequívoca, como las huellas digitales, y soportado sobre la tecnología celular más difundida en el mundo (GSM) se convierte en una prometedora técnica de gran impacto. Este documento muestra los resultados de un arduo trabajo en la búsqueda de este objetivo, y las conclusiones que se pudieron obtener. / Abstract. A voice recognition system is a system that recognizes a person who is speaking, given his or her voice registry. Nevertheless, all the developments that are found in the databases of papers, libraries and internet researchers, are always warning us about the same inconvenient, the given algorithms don´t throw statistic levels of success when those are applied over voice registries that have been obtained from cellular phones. The purpose of this work, is to propose a model that gives a satisfying success rate applied to voice registries taken through cellular phones in Colombia, and in this way open a interesting and new applications spectrum, that come from doing work interviews through the cellular phone until doing shopping o big bank transactions; form consulting the voice messages in the answering machine through the cell phone, until identify the speaker that talk in an intercepted communication in a law apprehension effort. All of this without the using of keys that can be stolen or forgotten, neither cards that can be lost. The voice would become an element of identification without errors, such as fingerprints, and supported in the most well known cellular technology in the world (GSM), with all these elements, this becomes a promising technology of great impact. This document pretends to show the results of the hard work in pursue for that objective, and the conclusions that could have got.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialGaravito Neira, Elkin Ramón (2010) Modelo de identificación de locutor en entornos GSM, aplicación en Colombia / Speaker recognition in GSM environments, application in Colombia. Maestría thesis, Universidad Nacional de Colombia.38 Comercio, comunicaciones, transporte / Commerce, communications and transportation62 Ingeniería y operaciones afines / EngineeringReconocimiento de vozProcesamiento de señalesMFCCCoeficientes cepstrales de frecuencia MELLPCCCoefficientes Cepstrales de predicción linealDWTTransformada discreta de WaveletVoice recognition Signal ProcessingMFCCMel Frequency Cepstral CoefficientsLPCCLinear Predicting Coding CoefficientsDWTDiscrete Wavelet TransformModelo de identificación de locutor en entornos GSM, aplicación en ColombiaSpeaker recognition in GSM environments, application in ColombiaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299634.2010.pdfapplication/pdf1462553https://repositorio.unal.edu.co/bitstream/unal/6896/1/299634.2010.pdfd217de5b97ee1a1240811336bca38ef2MD51THUMBNAIL299634.2010.pdf.jpg299634.2010.pdf.jpgGenerated Thumbnailimage/jpeg4197https://repositorio.unal.edu.co/bitstream/unal/6896/2/299634.2010.pdf.jpg3f1502f0de6005f287e4a6068f0fc04eMD52unal/6896oai:repositorio.unal.edu.co:unal/68962022-10-30 15:58:32.581Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |