Métodos de aprendizaje de máquina para el análisis automático de hipernasalidad en niños con labio y paladar hendido

RESUMEN : Los niños que han sido operados de labio y paladar hendido pueden presentar algunos problemas del habla. Uno de los problemas más comunes es la nasalización excesiva, la cual afecta la producción de ciertos sonidos y reduce la inteligibilidad del habla. En este trabajo, se presentan alguna...

Full description

Autores:
Londoño Mora, Elizabeth
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/31681
Acceso en línea:
https://hdl.handle.net/10495/31681
Palabra clave:
Fonética
Labio leporino
Aprendizaje automático (inteligencia artificial)
Reconocimiento automático de la voz
Redes neurales (computadores)
Trastornos del habla en niños
Fonemas
Hipernasalidad
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Description
Summary:RESUMEN : Los niños que han sido operados de labio y paladar hendido pueden presentar algunos problemas del habla. Uno de los problemas más comunes es la nasalización excesiva, la cual afecta la producción de ciertos sonidos y reduce la inteligibilidad del habla. En este trabajo, se presentan algunas técnicas de aprendizaje de y procesamiento de señales adecuadas para la evaluación automática del nivel de nasalización en la voz de niños que han sido operados de labio y paladar hendido. Para esto, se consideraron 88 grabaciones de niños cuyo lenguaje nativo es el español de Colombia y en inglés se tiene 44 grabaciones de niños cuyo lenguaje nativo es el inglés Hindú. Los pacientes de las grabaciones en español leyeron 6 frases, y fueron evaluados por un especialista, el cual los asigno en uno de cuatro posibles niveles de nasalización: 0, 1, 2 y 3 (donde 0 son personas sanas mientras que tres son personas con el máximo nivel de nasalización), mientras que los pacientes de las grabaciones en inglés leyeron 3 frases y para este caso los pacientes fueron divididos en dos grupos los cuales son las grabaciones de control (personas sanas) y personas con hipernasalización. El trabajo se divide en dos partes importantes las cuales son: primero la identificación de nasalización, donde en este momento lo que se realiza es aplicar a las diferentes grabaciones, una red neuronal pre-entrenada con diferentes métodos como lo son no supervisado, es decir analizar todos los fonemas postriors así no se encuentren presentes en la grabación, semi-supervisado, analizar solo los fonemas posterios presentes en el audio y supervisado para este se utiliza los que es el alineamiento forzado y de esta manera analizar cada fonema en el momento de tiempo en que son pronunciados, y con la comparación de estos tres métodos se busca identificar si es posible cuantificar la precisión con la que se producen algunos sonidos nasales, en un segundo momento se aplican diferentes métodos de clasificación como lo son máquina de soporte vectorial multiclase y PCA (este método solo es aplicado al mejor resultado obtenido de svm) a los resultados obtenidos por medio del alineamiento forzado, donde por medio de estos métodos de clasificación es posible detectar el nivel de nasalización con un acierto máximo del 56.0 %.