Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC...
- Autores:
-
Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
- Tipo de recurso:
- http://purl.org/coar/version/c_b1a7d7d4d402bcce
- Fecha de publicación:
- 2018
- Institución:
- Universidad Industrial de Santander
- Repositorio:
- Repositorio UIS
- Idioma:
- spa
- OAI Identifier:
- oai:noesis.uis.edu.co:20.500.14071/37829
- Palabra clave:
- Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
- Rights
- License
- Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id |
UISANTADR2_cf40a920c340ec73627ee6ef2b61d36e |
---|---|
oai_identifier_str |
oai:noesis.uis.edu.co:20.500.14071/37829 |
network_acronym_str |
UISANTADR2 |
network_name_str |
Repositorio UIS |
repository_id_str |
|
dc.title.none.fl_str_mv |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
dc.title.english.none.fl_str_mv |
Analysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice. |
title |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
spellingShingle |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz Tracto Vocal Formantes Coeficientes Cepstrales En Las Frecuencias De Mel Codificación Predictiva Lineal Validación Cruzada Imágenes Por Resonancia Magnética. Vocal Tract Formants Mel Frequency Cepstral Coefficients Linear Predictive Coding Cross Validation Magnetic Resonance Imaging. |
title_short |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
title_full |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
title_fullStr |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
title_full_unstemmed |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
title_sort |
Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz |
dc.creator.fl_str_mv |
Reyes Moreno, Julian Orlando Vasquez Serrano, Paula Andrea |
dc.contributor.advisor.none.fl_str_mv |
Sepulveda Sepulveda, Franklin Alexander |
dc.contributor.author.none.fl_str_mv |
Reyes Moreno, Julian Orlando Vasquez Serrano, Paula Andrea |
dc.subject.none.fl_str_mv |
Tracto Vocal Formantes Coeficientes Cepstrales En Las Frecuencias De Mel Codificación Predictiva Lineal Validación Cruzada Imágenes Por Resonancia Magnética. |
topic |
Tracto Vocal Formantes Coeficientes Cepstrales En Las Frecuencias De Mel Codificación Predictiva Lineal Validación Cruzada Imágenes Por Resonancia Magnética. Vocal Tract Formants Mel Frequency Cepstral Coefficients Linear Predictive Coding Cross Validation Magnetic Resonance Imaging. |
dc.subject.keyword.none.fl_str_mv |
Vocal Tract Formants Mel Frequency Cepstral Coefficients Linear Predictive Coding Cross Validation Magnetic Resonance Imaging. |
description |
En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos. |
publishDate |
2018 |
dc.date.available.none.fl_str_mv |
2018 2024-03-03T23:57:12Z |
dc.date.created.none.fl_str_mv |
2018 |
dc.date.issued.none.fl_str_mv |
2018 |
dc.date.accessioned.none.fl_str_mv |
2024-03-03T23:57:12Z |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
format |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.identifier.uri.none.fl_str_mv |
https://noesis.uis.edu.co/handle/20.500.14071/37829 |
dc.identifier.instname.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.reponame.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.repourl.none.fl_str_mv |
https://noesis.uis.edu.co |
url |
https://noesis.uis.edu.co/handle/20.500.14071/37829 https://noesis.uis.edu.co |
identifier_str_mv |
Universidad Industrial de Santander |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.none.fl_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0 |
dc.rights.creativecommons.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
rights_invalid_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) http://creativecommons.org/licenses/by/4.0/ http://creativecommons.org/licenses/by-nc/4.0 Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Industrial de Santander |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingenierías Fisicomecánicas |
dc.publisher.program.none.fl_str_mv |
Ingeniería Electrónica |
dc.publisher.school.none.fl_str_mv |
Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones |
publisher.none.fl_str_mv |
Universidad Industrial de Santander |
institution |
Universidad Industrial de Santander |
bitstream.url.fl_str_mv |
https://noesis.uis.edu.co/bitstreams/742d0520-89ae-4c13-b09f-233ec1aa57c3/download https://noesis.uis.edu.co/bitstreams/bccfa37a-c187-4ab2-ad00-af7762f8a04d/download https://noesis.uis.edu.co/bitstreams/1dc1eeef-0632-4632-82c7-b2c135365ae2/download |
bitstream.checksum.fl_str_mv |
28777ff66e389cbd7ab20805e7d71f44 cf623a388c37dba82106c40dc7cb3289 353bb966e056a0967917791fd24da84b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
DSpace at UIS |
repository.mail.fl_str_mv |
noesis@uis.edu.co |
_version_ |
1814095248022831104 |
spelling |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)http://creativecommons.org/licenses/by/4.0/http://creativecommons.org/licenses/by-nc/4.0Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2Sepulveda Sepulveda, Franklin AlexanderReyes Moreno, Julian OrlandoVasquez Serrano, Paula Andrea2024-03-03T23:57:12Z20182024-03-03T23:57:12Z20182018https://noesis.uis.edu.co/handle/20.500.14071/37829Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos.PregradoIngeniero ElectrónicoThe following document presents the evaluation of five different statistical models of linear type, to which the regression analysis were applied for the estimation of the vocal tract length from parameters of the human voice. For this purpose, the USCTIMIT database was used, this database has a set of audios and real-time magnetic resonance images (rt-MRI) of 10 speakers, from which the necessary parameters for the fit and validation of the models were extracted. Two different methods were used for the parameterization of the speech signal: the linear predictive coding (LPC), and the mel frequency cepstral coefficients (MFCC). The results obtained with these methods were compared, showing better results, in terms of the mean square error, the MFCC. The vocal tract length reference values were taken from the magnetic resonance images, this images were processed with an algorithm implemented in MATLAB. Tests were made forming different data sets, in order to analyze the behavior of the models, and the relation between the variables. In addition, k-fold cross validation tests were made for the evaluation and comparison of the models.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingenierías FisicomecánicasIngeniería ElectrónicaEscuela de Ingenierías Eléctrica, Electrónica y TelecomunicacionesTracto VocalFormantesCoeficientes Cepstrales En Las Frecuencias De MelCodificación Predictiva LinealValidación CruzadaImágenes Por Resonancia Magnética.Vocal TractFormantsMel Frequency Cepstral CoefficientsLinear Predictive CodingCross ValidationMagnetic Resonance Imaging.Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la vozAnalysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice.Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf2125029https://noesis.uis.edu.co/bitstreams/742d0520-89ae-4c13-b09f-233ec1aa57c3/download28777ff66e389cbd7ab20805e7d71f44MD51Documento.pdfapplication/pdf4531951https://noesis.uis.edu.co/bitstreams/bccfa37a-c187-4ab2-ad00-af7762f8a04d/downloadcf623a388c37dba82106c40dc7cb3289MD52Nota de proyecto.pdfapplication/pdf633321https://noesis.uis.edu.co/bitstreams/1dc1eeef-0632-4632-82c7-b2c135365ae2/download353bb966e056a0967917791fd24da84bMD5320.500.14071/37829oai:noesis.uis.edu.co:20.500.14071/378292024-03-03 18:57:12.54http://creativecommons.org/licenses/by-nc/4.0http://creativecommons.org/licenses/by/4.0/open.accesshttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co |