Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas

Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores...

Full description

Autores:
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/31293
Acceso en línea:
http://hdl.handle.net/11349/31293
Palabra clave:
CNN
RNN-LSTM
LSTM
Aumento de datos
Mala pronunciación en español
Ingeniería Electrónica - Tesis y disertaciones académicas
Neuronas
Red nerviosa
Español - Pronunciación
CNN
RNN-LSTM
LSTM
Data Augmentation
Spanish Mispronunciation
Rights
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento.