Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas
Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores...
- Autores:
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad Distrital Francisco José de Caldas
- Repositorio:
- RIUD: repositorio U. Distrital
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udistrital.edu.co:11349/31293
- Acceso en línea:
- http://hdl.handle.net/11349/31293
- Palabra clave:
- CNN
RNN-LSTM
LSTM
Aumento de datos
Mala pronunciación en español
Ingeniería Electrónica - Tesis y disertaciones académicas
Neuronas
Red nerviosa
Español - Pronunciación
CNN
RNN-LSTM
LSTM
Data Augmentation
Spanish Mispronunciation
- Rights
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento. |
---|