Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.

Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unida...

Full description

Autores:
Romo Melo, Liliana Minelly
Tipo de recurso:
Fecha de publicación:
2005
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/2845
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/2845
http://bdigital.unal.edu.co/1218/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Labio leporino
Fonoaudiología
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_14827e8d0354e91094e4a949fc19a9fb
oai_identifier_str oai:repositorio.unal.edu.co:unal/2845
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
title Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
spellingShingle Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
62 Ingeniería y operaciones afines / Engineering
Labio leporino
Fonoaudiología
title_short Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
title_full Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
title_fullStr Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
title_full_unstemmed Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
title_sort Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
dc.creator.fl_str_mv Romo Melo, Liliana Minelly
dc.contributor.advisor.spa.fl_str_mv Castellanos Domínguez, César Germán (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Romo Melo, Liliana Minelly
dc.subject.ddc.spa.fl_str_mv 62 Ingeniería y operaciones afines / Engineering
topic 62 Ingeniería y operaciones afines / Engineering
Labio leporino
Fonoaudiología
dc.subject.proposal.spa.fl_str_mv Labio leporino
Fonoaudiología
description Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unidades y técnicas de predicción lineal. El sintetizador utiliza un diccionario de dominio restringido y frases de estructura limitada, las cuales están enfocadas en las terapias de rehabilitación fonoaudiológica de las patologías de la voz y el habla, originadas por alteraciones fisiológicas en el aparato fonoarticulatorio de pacientes con Labio y/o Paladar Hendido corregido; se consideran también, las características prosódicas de la región central del país. El trabajo demostró que el desarrollo de la arquitectura de concatenación híbrida de unidades de frases y palabras completas, logra conservar las características prosódicas y de identidad fonética. La comparación de las diferentes técnicas para generación de voz sintética, demostró que no es viable con una sola de ellas generar una calidad aceptable de voz, que no cause rechazo por parte del paciente a largo plazo. El uso de algoritmos Concatenative Length Unit Selection-CLUS, permitió obtener resultados satisfactorios en la naturalidad requerida, minimizando el ruido de codificación; no obstante se elevó el grado de complejidad del sistema y el costo computacional. Para palabras aisladas no disponibles en el corpus de listas ligadas, se recurrió a la implementación de algoritmos Pitch Synchronous Overlap Add -PSOLA, diferentes para cada tipo de sonido, según sea sonoro o sordo. Finalmente se comentan los resultados obtenidos, al aplicar este método de generación de la voz sintética a las terapias de rehabilitación fonoaudiológica de algunas de las patologías de la voz y el habla, originadas por alteraciones en la fisiología y la dinámica muscular del aparato fonoarticulatorio en pacientes con LPH -Labio y/o Paladar Hendido corregido, que presentan IVF -Incompetencia Velo Faríngea, con edades entre 5 a 15 años. / Abstract: Characteristics this work describes the developments of an artificial speech synthesis system based on unit concatenation hybrid and linear prediction techniques. The synthesis system uses a dictionary of restricted domain and phrases of limited writing, which are focused on the phonoaudilogic rehabilitation therapies of speech and voice pathologies, originated by physiological abnormalities inside the phonoartoculatory apparatus of children with clef lip and palate corrected; it is also considered the prosodic features of the central region of the country. The research demonstrated the development of the hybrid concatenation architecture of unit phrases and whole words keeps the prosodic features and identity. The comparison of different techniques to generate synthetic speech demonstrated that it is not attainable with just one of them to generate an acceptable quality of speech without rejection from the patient in a long time. Using of concatenative length unit selection algorithms CLUS lets to obtain successfulness results in the required nature of the speech, decreasing the codification noise. Despite, the grade of complexity was increased, as well as its computational cost. For isolated words non available in the corpus of bounded lists, it was implemented pitch synchronous overlap add algorithms PSOLA, which were different for each kind of sound, according with its sonority. Finally, the obtained results are commented when this method is applied to synthetic speech generation and phonoaudilogic rehabilitation techniques in some speech and voice pathologies, originated by abnormalities in the physiology and muscle dynamics of the phonoarticulatory apparatus in children with clef lip and palate corrected with presence of VFI, whose ages are between 5 and 15 years old.
publishDate 2005
dc.date.issued.spa.fl_str_mv 2005-05
dc.date.accessioned.spa.fl_str_mv 2019-06-24T12:54:26Z
dc.date.available.spa.fl_str_mv 2019-06-24T12:54:26Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/2845
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/1218/
url https://repositorio.unal.edu.co/handle/unal/2845
http://bdigital.unal.edu.co/1218/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación
Departamento de Ingeniería Eléctrica, Electrónica y Computación
dc.relation.references.spa.fl_str_mv Romo Melo, Liliana Minelly (2005) Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/2845/1/lilianaminellyromomelo.2005.pdf
https://repositorio.unal.edu.co/bitstream/unal/2845/2/lilianaminellyromomelo.2005.pdf.jpg
bitstream.checksum.fl_str_mv 59a546b000583e0286567c40cb9cc2f8
ea8c54ccec343b39c63237fa974efb14
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886093124009984
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Domínguez, César Germán (Thesis advisor)40af5ca8-3cf6-4f6d-a8b9-cd3d6b73bf61-1Romo Melo, Liliana Minelly74f6be9e-bdb8-43f4-b859-cec8375554fd3002019-06-24T12:54:26Z2019-06-24T12:54:26Z2005-05https://repositorio.unal.edu.co/handle/unal/2845http://bdigital.unal.edu.co/1218/Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unidades y técnicas de predicción lineal. El sintetizador utiliza un diccionario de dominio restringido y frases de estructura limitada, las cuales están enfocadas en las terapias de rehabilitación fonoaudiológica de las patologías de la voz y el habla, originadas por alteraciones fisiológicas en el aparato fonoarticulatorio de pacientes con Labio y/o Paladar Hendido corregido; se consideran también, las características prosódicas de la región central del país. El trabajo demostró que el desarrollo de la arquitectura de concatenación híbrida de unidades de frases y palabras completas, logra conservar las características prosódicas y de identidad fonética. La comparación de las diferentes técnicas para generación de voz sintética, demostró que no es viable con una sola de ellas generar una calidad aceptable de voz, que no cause rechazo por parte del paciente a largo plazo. El uso de algoritmos Concatenative Length Unit Selection-CLUS, permitió obtener resultados satisfactorios en la naturalidad requerida, minimizando el ruido de codificación; no obstante se elevó el grado de complejidad del sistema y el costo computacional. Para palabras aisladas no disponibles en el corpus de listas ligadas, se recurrió a la implementación de algoritmos Pitch Synchronous Overlap Add -PSOLA, diferentes para cada tipo de sonido, según sea sonoro o sordo. Finalmente se comentan los resultados obtenidos, al aplicar este método de generación de la voz sintética a las terapias de rehabilitación fonoaudiológica de algunas de las patologías de la voz y el habla, originadas por alteraciones en la fisiología y la dinámica muscular del aparato fonoarticulatorio en pacientes con LPH -Labio y/o Paladar Hendido corregido, que presentan IVF -Incompetencia Velo Faríngea, con edades entre 5 a 15 años. / Abstract: Characteristics this work describes the developments of an artificial speech synthesis system based on unit concatenation hybrid and linear prediction techniques. The synthesis system uses a dictionary of restricted domain and phrases of limited writing, which are focused on the phonoaudilogic rehabilitation therapies of speech and voice pathologies, originated by physiological abnormalities inside the phonoartoculatory apparatus of children with clef lip and palate corrected; it is also considered the prosodic features of the central region of the country. The research demonstrated the development of the hybrid concatenation architecture of unit phrases and whole words keeps the prosodic features and identity. The comparison of different techniques to generate synthetic speech demonstrated that it is not attainable with just one of them to generate an acceptable quality of speech without rejection from the patient in a long time. Using of concatenative length unit selection algorithms CLUS lets to obtain successfulness results in the required nature of the speech, decreasing the codification noise. Despite, the grade of complexity was increased, as well as its computational cost. For isolated words non available in the corpus of bounded lists, it was implemented pitch synchronous overlap add algorithms PSOLA, which were different for each kind of sound, according with its sonority. Finally, the obtained results are commented when this method is applied to synthetic speech generation and phonoaudilogic rehabilitation techniques in some speech and voice pathologies, originated by abnormalities in the physiology and muscle dynamics of the phonoarticulatory apparatus in children with clef lip and palate corrected with presence of VFI, whose ages are between 5 and 15 years old.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y ComputaciónDepartamento de Ingeniería Eléctrica, Electrónica y ComputaciónRomo Melo, Liliana Minelly (2005) Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.62 Ingeniería y operaciones afines / EngineeringLabio leporinoFonoaudiologíaSíntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALlilianaminellyromomelo.2005.pdfapplication/pdf4579772https://repositorio.unal.edu.co/bitstream/unal/2845/1/lilianaminellyromomelo.2005.pdf59a546b000583e0286567c40cb9cc2f8MD51THUMBNAILlilianaminellyromomelo.2005.pdf.jpglilianaminellyromomelo.2005.pdf.jpgGenerated Thumbnailimage/jpeg4923https://repositorio.unal.edu.co/bitstream/unal/2845/2/lilianaminellyromomelo.2005.pdf.jpgea8c54ccec343b39c63237fa974efb14MD52unal/2845oai:repositorio.unal.edu.co:unal/28452022-08-31 23:06:20.025Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co