Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz

En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC...

Full description

Autores:
Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2018
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/37829
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/37829
https://noesis.uis.edu.co
Palabra clave:
Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id UISANTADR2_cf40a920c340ec73627ee6ef2b61d36e
oai_identifier_str oai:noesis.uis.edu.co:20.500.14071/37829
network_acronym_str UISANTADR2
network_name_str Repositorio UIS
repository_id_str
dc.title.none.fl_str_mv Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
dc.title.english.none.fl_str_mv Analysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice.
title Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
spellingShingle Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
title_short Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
title_full Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
title_fullStr Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
title_full_unstemmed Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
title_sort Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
dc.creator.fl_str_mv Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
dc.contributor.advisor.none.fl_str_mv Sepulveda Sepulveda, Franklin Alexander
dc.contributor.author.none.fl_str_mv Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
dc.subject.none.fl_str_mv Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
topic Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
dc.subject.keyword.none.fl_str_mv Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
description En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos.
publishDate 2018
dc.date.available.none.fl_str_mv 2018
2024-03-03T23:57:12Z
dc.date.created.none.fl_str_mv 2018
dc.date.issued.none.fl_str_mv 2018
dc.date.accessioned.none.fl_str_mv 2024-03-03T23:57:12Z
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
format http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.identifier.uri.none.fl_str_mv https://noesis.uis.edu.co/handle/20.500.14071/37829
dc.identifier.instname.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.reponame.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.repourl.none.fl_str_mv https://noesis.uis.edu.co
url https://noesis.uis.edu.co/handle/20.500.14071/37829
https://noesis.uis.edu.co
identifier_str_mv Universidad Industrial de Santander
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.none.fl_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
rights_invalid_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
http://creativecommons.org/licenses/by/4.0/
http://creativecommons.org/licenses/by-nc/4.0
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Industrial de Santander
dc.publisher.faculty.none.fl_str_mv Facultad de Ingenierías Fisicomecánicas
dc.publisher.program.none.fl_str_mv Ingeniería Electrónica
dc.publisher.school.none.fl_str_mv Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
publisher.none.fl_str_mv Universidad Industrial de Santander
institution Universidad Industrial de Santander
bitstream.url.fl_str_mv https://noesis.uis.edu.co/bitstreams/742d0520-89ae-4c13-b09f-233ec1aa57c3/download
https://noesis.uis.edu.co/bitstreams/bccfa37a-c187-4ab2-ad00-af7762f8a04d/download
https://noesis.uis.edu.co/bitstreams/1dc1eeef-0632-4632-82c7-b2c135365ae2/download
bitstream.checksum.fl_str_mv 28777ff66e389cbd7ab20805e7d71f44
cf623a388c37dba82106c40dc7cb3289
353bb966e056a0967917791fd24da84b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv DSpace at UIS
repository.mail.fl_str_mv noesis@uis.edu.co
_version_ 1814095248022831104
spelling Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)http://creativecommons.org/licenses/by/4.0/http://creativecommons.org/licenses/by-nc/4.0Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2Sepulveda Sepulveda, Franklin AlexanderReyes Moreno, Julian OrlandoVasquez Serrano, Paula Andrea2024-03-03T23:57:12Z20182024-03-03T23:57:12Z20182018https://noesis.uis.edu.co/handle/20.500.14071/37829Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos.PregradoIngeniero ElectrónicoThe following document presents the evaluation of five different statistical models of linear type, to which the regression analysis were applied for the estimation of the vocal tract length from parameters of the human voice. For this purpose, the USCTIMIT database was used, this database has a set of audios and real-time magnetic resonance images (rt-MRI) of 10 speakers, from which the necessary parameters for the fit and validation of the models were extracted. Two different methods were used for the parameterization of the speech signal: the linear predictive coding (LPC), and the mel frequency cepstral coefficients (MFCC). The results obtained with these methods were compared, showing better results, in terms of the mean square error, the MFCC. The vocal tract length reference values were taken from the magnetic resonance images, this images were processed with an algorithm implemented in MATLAB. Tests were made forming different data sets, in order to analyze the behavior of the models, and the relation between the variables. In addition, k-fold cross validation tests were made for the evaluation and comparison of the models.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingenierías FisicomecánicasIngeniería ElectrónicaEscuela de Ingenierías Eléctrica, Electrónica y TelecomunicacionesTracto VocalFormantesCoeficientes Cepstrales En Las Frecuencias De MelCodificación Predictiva LinealValidación CruzadaImágenes Por Resonancia Magnética.Vocal TractFormantsMel Frequency Cepstral CoefficientsLinear Predictive CodingCross ValidationMagnetic Resonance Imaging.Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la vozAnalysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice.Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf2125029https://noesis.uis.edu.co/bitstreams/742d0520-89ae-4c13-b09f-233ec1aa57c3/download28777ff66e389cbd7ab20805e7d71f44MD51Documento.pdfapplication/pdf4531951https://noesis.uis.edu.co/bitstreams/bccfa37a-c187-4ab2-ad00-af7762f8a04d/downloadcf623a388c37dba82106c40dc7cb3289MD52Nota de proyecto.pdfapplication/pdf633321https://noesis.uis.edu.co/bitstreams/1dc1eeef-0632-4632-82c7-b2c135365ae2/download353bb966e056a0967917791fd24da84bMD5320.500.14071/37829oai:noesis.uis.edu.co:20.500.14071/378292024-03-03 18:57:12.54http://creativecommons.org/licenses/by-nc/4.0http://creativecommons.org/licenses/by/4.0/open.accesshttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co