Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.

Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unida...

Full description

Autores:
Romo Melo, Liliana Minelly
Tipo de recurso:
Fecha de publicación:
2005
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/2845
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/2845
http://bdigital.unal.edu.co/1218/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Labio leporino
Fonoaudiología
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unidades y técnicas de predicción lineal. El sintetizador utiliza un diccionario de dominio restringido y frases de estructura limitada, las cuales están enfocadas en las terapias de rehabilitación fonoaudiológica de las patologías de la voz y el habla, originadas por alteraciones fisiológicas en el aparato fonoarticulatorio de pacientes con Labio y/o Paladar Hendido corregido; se consideran también, las características prosódicas de la región central del país. El trabajo demostró que el desarrollo de la arquitectura de concatenación híbrida de unidades de frases y palabras completas, logra conservar las características prosódicas y de identidad fonética. La comparación de las diferentes técnicas para generación de voz sintética, demostró que no es viable con una sola de ellas generar una calidad aceptable de voz, que no cause rechazo por parte del paciente a largo plazo. El uso de algoritmos Concatenative Length Unit Selection-CLUS, permitió obtener resultados satisfactorios en la naturalidad requerida, minimizando el ruido de codificación; no obstante se elevó el grado de complejidad del sistema y el costo computacional. Para palabras aisladas no disponibles en el corpus de listas ligadas, se recurrió a la implementación de algoritmos Pitch Synchronous Overlap Add -PSOLA, diferentes para cada tipo de sonido, según sea sonoro o sordo. Finalmente se comentan los resultados obtenidos, al aplicar este método de generación de la voz sintética a las terapias de rehabilitación fonoaudiológica de algunas de las patologías de la voz y el habla, originadas por alteraciones en la fisiología y la dinámica muscular del aparato fonoarticulatorio en pacientes con LPH -Labio y/o Paladar Hendido corregido, que presentan IVF -Incompetencia Velo Faríngea, con edades entre 5 a 15 años. / Abstract: Characteristics this work describes the developments of an artificial speech synthesis system based on unit concatenation hybrid and linear prediction techniques. The synthesis system uses a dictionary of restricted domain and phrases of limited writing, which are focused on the phonoaudilogic rehabilitation therapies of speech and voice pathologies, originated by physiological abnormalities inside the phonoartoculatory apparatus of children with clef lip and palate corrected; it is also considered the prosodic features of the central region of the country. The research demonstrated the development of the hybrid concatenation architecture of unit phrases and whole words keeps the prosodic features and identity. The comparison of different techniques to generate synthetic speech demonstrated that it is not attainable with just one of them to generate an acceptable quality of speech without rejection from the patient in a long time. Using of concatenative length unit selection algorithms CLUS lets to obtain successfulness results in the required nature of the speech, decreasing the codification noise. Despite, the grade of complexity was increased, as well as its computational cost. For isolated words non available in the corpus of bounded lists, it was implemented pitch synchronous overlap add algorithms PSOLA, which were different for each kind of sound, according with its sonority. Finally, the obtained results are commented when this method is applied to synthetic speech generation and phonoaudilogic rehabilitation techniques in some speech and voice pathologies, originated by abnormalities in the physiology and muscle dynamics of the phonoarticulatory apparatus in children with clef lip and palate corrected with presence of VFI, whose ages are between 5 and 15 years old.