Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia

En este trabajo se presenta la extracción de características de señales de voz basada en transformada wavelet. Las características se pueden clasificar en los tipos acústico y de representación. Dentro de las características acústicas aparecen la frecuencia fundamental y la de medida de ruido de seña...

Full description

Autores:
Sepúlveda Sepúlveda, Franklin Alexander
Tipo de recurso:
Fecha de publicación:
2004
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/2723
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/2723
http://bdigital.unal.edu.co/1092/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Procesamiento de señales
Sistemas de procesamiento de la voz
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_b664386eb5c0608bbd5aeb4cefece652
oai_identifier_str oai:repositorio.unal.edu.co:unal/2723
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Domínguez, Germán (Thesis advisor)03c560e0-07b6-41e7-a1e9-48bf280b2570-1Sepúlveda Sepúlveda, Franklin Alexander00990ef0-2db6-469e-8f10-19376089be253002019-06-24T12:53:38Z2019-06-24T12:53:38Z2004https://repositorio.unal.edu.co/handle/unal/2723http://bdigital.unal.edu.co/1092/En este trabajo se presenta la extracción de características de señales de voz basada en transformada wavelet. Las características se pueden clasificar en los tipos acústico y de representación. Dentro de las características acústicas aparecen la frecuencia fundamental y la de medida de ruido de señales de voz. Para la estimación de la frecuencia fundamental se aplica un nuevo método, el cual usa la correlación de distancias entre las escalas de descomposición en lugar de usar la correlación de posiciones de máximos locales en las escalas. Para la obtener la medida de ruido de las señales de voz se usa un método basado en la transformada wavelet packet. Para la obtención de las características de representación se usan varia estrategias, la más simple de ella es usando la transformada wavelet diádica, y las otras se basan en el diccionario de bases generado a partir de la transformada wavelet packet, entre ellas Local Discriminant Bases. / Abstract. This work present methods for feature extraction of speech signals based on wavelet transform. The features can be organized in two categories, acoustic and representation. Present a new method for pitch estimation and use the wavelet packet transform for noise estimation. For extraction of representation features use the dyadic wavelet transform and schemes based on wavelet packet transform, por ejemplo, Local Discriminant Bases. This features are used for pathological voices classification and are evaluated using Linear Discriminant Analysis. As preprocessing technique we use an algorithm for voiced/unvoiced decision an later apply pitch estimation. The results are compared with other methods. An improvement pitch detection algorithm based on the Wavelet Transform (WT) of speech signal is proposed. The method obtains a value of the fundamental frequency for each pitch period, is described and evaluated. In contrast with other methods, which chooses maximums if they occur in two adjacent wavelet coefficient scales, distances between adjacent local maximums are chosen for each scale. This method is computationally inexpensive and through real speech experiments shows that it is both accurate and robust to noise.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y ArquitecturaFacultad de Ingeniería y ArquitecturaSepúlveda Sepúlveda, Franklin Alexander (2004) Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.62 Ingeniería y operaciones afines / EngineeringProcesamiento de señalesSistemas de procesamiento de la vozExtracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuenciaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALfranklinalexandersepulvedasepulveda.2004.pdfapplication/pdf2406761https://repositorio.unal.edu.co/bitstream/unal/2723/1/franklinalexandersepulvedasepulveda.2004.pdf127bf863ce47acaaf19b338caf0e267eMD51THUMBNAILfranklinalexandersepulvedasepulveda.2004.pdf.jpgfranklinalexandersepulvedasepulveda.2004.pdf.jpgGenerated Thumbnailimage/jpeg4575https://repositorio.unal.edu.co/bitstream/unal/2723/2/franklinalexandersepulvedasepulveda.2004.pdf.jpge802dc4f2520a02279906a2bcf45bf06MD52unal/2723oai:repositorio.unal.edu.co:unal/27232023-08-20 23:04:50.774Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
title Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
spellingShingle Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
62 Ingeniería y operaciones afines / Engineering
Procesamiento de señales
Sistemas de procesamiento de la voz
title_short Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
title_full Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
title_fullStr Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
title_full_unstemmed Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
title_sort Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
dc.creator.fl_str_mv Sepúlveda Sepúlveda, Franklin Alexander
dc.contributor.advisor.spa.fl_str_mv Castellanos Domínguez, Germán (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Sepúlveda Sepúlveda, Franklin Alexander
dc.subject.ddc.spa.fl_str_mv 62 Ingeniería y operaciones afines / Engineering
topic 62 Ingeniería y operaciones afines / Engineering
Procesamiento de señales
Sistemas de procesamiento de la voz
dc.subject.proposal.spa.fl_str_mv Procesamiento de señales
Sistemas de procesamiento de la voz
description En este trabajo se presenta la extracción de características de señales de voz basada en transformada wavelet. Las características se pueden clasificar en los tipos acústico y de representación. Dentro de las características acústicas aparecen la frecuencia fundamental y la de medida de ruido de señales de voz. Para la estimación de la frecuencia fundamental se aplica un nuevo método, el cual usa la correlación de distancias entre las escalas de descomposición en lugar de usar la correlación de posiciones de máximos locales en las escalas. Para la obtener la medida de ruido de las señales de voz se usa un método basado en la transformada wavelet packet. Para la obtención de las características de representación se usan varia estrategias, la más simple de ella es usando la transformada wavelet diádica, y las otras se basan en el diccionario de bases generado a partir de la transformada wavelet packet, entre ellas Local Discriminant Bases. / Abstract. This work present methods for feature extraction of speech signals based on wavelet transform. The features can be organized in two categories, acoustic and representation. Present a new method for pitch estimation and use the wavelet packet transform for noise estimation. For extraction of representation features use the dyadic wavelet transform and schemes based on wavelet packet transform, por ejemplo, Local Discriminant Bases. This features are used for pathological voices classification and are evaluated using Linear Discriminant Analysis. As preprocessing technique we use an algorithm for voiced/unvoiced decision an later apply pitch estimation. The results are compared with other methods. An improvement pitch detection algorithm based on the Wavelet Transform (WT) of speech signal is proposed. The method obtains a value of the fundamental frequency for each pitch period, is described and evaluated. In contrast with other methods, which chooses maximums if they occur in two adjacent wavelet coefficient scales, distances between adjacent local maximums are chosen for each scale. This method is computationally inexpensive and through real speech experiments shows that it is both accurate and robust to noise.
publishDate 2004
dc.date.issued.spa.fl_str_mv 2004
dc.date.accessioned.spa.fl_str_mv 2019-06-24T12:53:38Z
dc.date.available.spa.fl_str_mv 2019-06-24T12:53:38Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/2723
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/1092/
url https://repositorio.unal.edu.co/handle/unal/2723
http://bdigital.unal.edu.co/1092/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura
Facultad de Ingeniería y Arquitectura
dc.relation.references.spa.fl_str_mv Sepúlveda Sepúlveda, Franklin Alexander (2004) Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/2723/1/franklinalexandersepulvedasepulveda.2004.pdf
https://repositorio.unal.edu.co/bitstream/unal/2723/2/franklinalexandersepulvedasepulveda.2004.pdf.jpg
bitstream.checksum.fl_str_mv 127bf863ce47acaaf19b338caf0e267e
e802dc4f2520a02279906a2bcf45bf06
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886002971639808