Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.
Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unida...
- Autores:
-
Romo Melo, Liliana Minelly
- Tipo de recurso:
- Fecha de publicación:
- 2005
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/2845
- Palabra clave:
- 62 Ingeniería y operaciones afines / Engineering
Labio leporino
Fonoaudiología
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_14827e8d0354e91094e4a949fc19a9fb |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/2845 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
title |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
spellingShingle |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. 62 Ingeniería y operaciones afines / Engineering Labio leporino Fonoaudiología |
title_short |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
title_full |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
title_fullStr |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
title_full_unstemmed |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
title_sort |
Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. |
dc.creator.fl_str_mv |
Romo Melo, Liliana Minelly |
dc.contributor.advisor.spa.fl_str_mv |
Castellanos Domínguez, César Germán (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Romo Melo, Liliana Minelly |
dc.subject.ddc.spa.fl_str_mv |
62 Ingeniería y operaciones afines / Engineering |
topic |
62 Ingeniería y operaciones afines / Engineering Labio leporino Fonoaudiología |
dc.subject.proposal.spa.fl_str_mv |
Labio leporino Fonoaudiología |
description |
Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unidades y técnicas de predicción lineal. El sintetizador utiliza un diccionario de dominio restringido y frases de estructura limitada, las cuales están enfocadas en las terapias de rehabilitación fonoaudiológica de las patologías de la voz y el habla, originadas por alteraciones fisiológicas en el aparato fonoarticulatorio de pacientes con Labio y/o Paladar Hendido corregido; se consideran también, las características prosódicas de la región central del país. El trabajo demostró que el desarrollo de la arquitectura de concatenación híbrida de unidades de frases y palabras completas, logra conservar las características prosódicas y de identidad fonética. La comparación de las diferentes técnicas para generación de voz sintética, demostró que no es viable con una sola de ellas generar una calidad aceptable de voz, que no cause rechazo por parte del paciente a largo plazo. El uso de algoritmos Concatenative Length Unit Selection-CLUS, permitió obtener resultados satisfactorios en la naturalidad requerida, minimizando el ruido de codificación; no obstante se elevó el grado de complejidad del sistema y el costo computacional. Para palabras aisladas no disponibles en el corpus de listas ligadas, se recurrió a la implementación de algoritmos Pitch Synchronous Overlap Add -PSOLA, diferentes para cada tipo de sonido, según sea sonoro o sordo. Finalmente se comentan los resultados obtenidos, al aplicar este método de generación de la voz sintética a las terapias de rehabilitación fonoaudiológica de algunas de las patologías de la voz y el habla, originadas por alteraciones en la fisiología y la dinámica muscular del aparato fonoarticulatorio en pacientes con LPH -Labio y/o Paladar Hendido corregido, que presentan IVF -Incompetencia Velo Faríngea, con edades entre 5 a 15 años. / Abstract: Characteristics this work describes the developments of an artificial speech synthesis system based on unit concatenation hybrid and linear prediction techniques. The synthesis system uses a dictionary of restricted domain and phrases of limited writing, which are focused on the phonoaudilogic rehabilitation therapies of speech and voice pathologies, originated by physiological abnormalities inside the phonoartoculatory apparatus of children with clef lip and palate corrected; it is also considered the prosodic features of the central region of the country. The research demonstrated the development of the hybrid concatenation architecture of unit phrases and whole words keeps the prosodic features and identity. The comparison of different techniques to generate synthetic speech demonstrated that it is not attainable with just one of them to generate an acceptable quality of speech without rejection from the patient in a long time. Using of concatenative length unit selection algorithms CLUS lets to obtain successfulness results in the required nature of the speech, decreasing the codification noise. Despite, the grade of complexity was increased, as well as its computational cost. For isolated words non available in the corpus of bounded lists, it was implemented pitch synchronous overlap add algorithms PSOLA, which were different for each kind of sound, according with its sonority. Finally, the obtained results are commented when this method is applied to synthetic speech generation and phonoaudilogic rehabilitation techniques in some speech and voice pathologies, originated by abnormalities in the physiology and muscle dynamics of the phonoarticulatory apparatus in children with clef lip and palate corrected with presence of VFI, whose ages are between 5 and 15 years old. |
publishDate |
2005 |
dc.date.issued.spa.fl_str_mv |
2005-05 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T12:54:26Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T12:54:26Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/2845 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/1218/ |
url |
https://repositorio.unal.edu.co/handle/unal/2845 http://bdigital.unal.edu.co/1218/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Departamento de Ingeniería Eléctrica, Electrónica y Computación |
dc.relation.references.spa.fl_str_mv |
Romo Melo, Liliana Minelly (2005) Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/2845/1/lilianaminellyromomelo.2005.pdf https://repositorio.unal.edu.co/bitstream/unal/2845/2/lilianaminellyromomelo.2005.pdf.jpg |
bitstream.checksum.fl_str_mv |
59a546b000583e0286567c40cb9cc2f8 ea8c54ccec343b39c63237fa974efb14 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089407828852736 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Domínguez, César Germán (Thesis advisor)40af5ca8-3cf6-4f6d-a8b9-cd3d6b73bf61-1Romo Melo, Liliana Minelly74f6be9e-bdb8-43f4-b859-cec8375554fd3002019-06-24T12:54:26Z2019-06-24T12:54:26Z2005-05https://repositorio.unal.edu.co/handle/unal/2845http://bdigital.unal.edu.co/1218/Con este trabajo se presenta la tesis realizada dentro del programa de magister en automatización industrial como uno de los requisitos para optar a este título de posgrado. Se describen los desarrollos de un sistema de síntesis de voz artificial basado en técnicas híbridas de concatenación de unidades y técnicas de predicción lineal. El sintetizador utiliza un diccionario de dominio restringido y frases de estructura limitada, las cuales están enfocadas en las terapias de rehabilitación fonoaudiológica de las patologías de la voz y el habla, originadas por alteraciones fisiológicas en el aparato fonoarticulatorio de pacientes con Labio y/o Paladar Hendido corregido; se consideran también, las características prosódicas de la región central del país. El trabajo demostró que el desarrollo de la arquitectura de concatenación híbrida de unidades de frases y palabras completas, logra conservar las características prosódicas y de identidad fonética. La comparación de las diferentes técnicas para generación de voz sintética, demostró que no es viable con una sola de ellas generar una calidad aceptable de voz, que no cause rechazo por parte del paciente a largo plazo. El uso de algoritmos Concatenative Length Unit Selection-CLUS, permitió obtener resultados satisfactorios en la naturalidad requerida, minimizando el ruido de codificación; no obstante se elevó el grado de complejidad del sistema y el costo computacional. Para palabras aisladas no disponibles en el corpus de listas ligadas, se recurrió a la implementación de algoritmos Pitch Synchronous Overlap Add -PSOLA, diferentes para cada tipo de sonido, según sea sonoro o sordo. Finalmente se comentan los resultados obtenidos, al aplicar este método de generación de la voz sintética a las terapias de rehabilitación fonoaudiológica de algunas de las patologías de la voz y el habla, originadas por alteraciones en la fisiología y la dinámica muscular del aparato fonoarticulatorio en pacientes con LPH -Labio y/o Paladar Hendido corregido, que presentan IVF -Incompetencia Velo Faríngea, con edades entre 5 a 15 años. / Abstract: Characteristics this work describes the developments of an artificial speech synthesis system based on unit concatenation hybrid and linear prediction techniques. The synthesis system uses a dictionary of restricted domain and phrases of limited writing, which are focused on the phonoaudilogic rehabilitation therapies of speech and voice pathologies, originated by physiological abnormalities inside the phonoartoculatory apparatus of children with clef lip and palate corrected; it is also considered the prosodic features of the central region of the country. The research demonstrated the development of the hybrid concatenation architecture of unit phrases and whole words keeps the prosodic features and identity. The comparison of different techniques to generate synthetic speech demonstrated that it is not attainable with just one of them to generate an acceptable quality of speech without rejection from the patient in a long time. Using of concatenative length unit selection algorithms CLUS lets to obtain successfulness results in the required nature of the speech, decreasing the codification noise. Despite, the grade of complexity was increased, as well as its computational cost. For isolated words non available in the corpus of bounded lists, it was implemented pitch synchronous overlap add algorithms PSOLA, which were different for each kind of sound, according with its sonority. Finally, the obtained results are commented when this method is applied to synthetic speech generation and phonoaudilogic rehabilitation techniques in some speech and voice pathologies, originated by abnormalities in the physiology and muscle dynamics of the phonoarticulatory apparatus in children with clef lip and palate corrected with presence of VFI, whose ages are between 5 and 15 years old.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y ComputaciónDepartamento de Ingeniería Eléctrica, Electrónica y ComputaciónRomo Melo, Liliana Minelly (2005) Síntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.62 Ingeniería y operaciones afines / EngineeringLabio leporinoFonoaudiologíaSíntesis de la voz aplicada a la rehabilitación de pacientes con labio y paladar hendido corregido.Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALlilianaminellyromomelo.2005.pdfapplication/pdf4579772https://repositorio.unal.edu.co/bitstream/unal/2845/1/lilianaminellyromomelo.2005.pdf59a546b000583e0286567c40cb9cc2f8MD51THUMBNAILlilianaminellyromomelo.2005.pdf.jpglilianaminellyromomelo.2005.pdf.jpgGenerated Thumbnailimage/jpeg4923https://repositorio.unal.edu.co/bitstream/unal/2845/2/lilianaminellyromomelo.2005.pdf.jpgea8c54ccec343b39c63237fa974efb14MD52unal/2845oai:repositorio.unal.edu.co:unal/28452022-08-31 23:06:20.025Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |