Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz

En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC...

Full description

Autores:
Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2018
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/37829
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/37829
https://noesis.uis.edu.co
Palabra clave:
Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
Description
Summary:En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos.