Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC...
- Autores:
-
Reyes Moreno, Julian Orlando
Vasquez Serrano, Paula Andrea
- Tipo de recurso:
- http://purl.org/coar/version/c_b1a7d7d4d402bcce
- Fecha de publicación:
- 2018
- Institución:
- Universidad Industrial de Santander
- Repositorio:
- Repositorio UIS
- Idioma:
- spa
- OAI Identifier:
- oai:noesis.uis.edu.co:20.500.14071/37829
- Palabra clave:
- Tracto Vocal
Formantes
Coeficientes Cepstrales En Las Frecuencias De Mel
Codificación Predictiva Lineal
Validación Cruzada
Imágenes Por Resonancia Magnética.
Vocal Tract
Formants
Mel Frequency Cepstral Coefficients
Linear Predictive Coding
Cross Validation
Magnetic Resonance Imaging.
- Rights
- License
- Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
Summary: | En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos. |
---|