Analysis of Pathological Speech Signals
ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings cap...
- Autores:
-
Arias Vergara, Tomás
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2022
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- eng
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/31409
- Acceso en línea:
- https://hdl.handle.net/10495/31409
- Palabra clave:
- Deep Learning
Aprendizaje profundo
Parkinson Disease
Enfermedad de parkinson
Speech Recognition Software
Software de Reconocimiento del Habla
Cochlear Implants
Implantes Cocleares
Aging
Envejecimiento
Machine learning
Aprendizaje automático (inteligencia artificial)
Speech processing
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by/2.5/co/
id |
UDEA2_7d5fe46c9ca91e0d9b6885954f2c1f98 |
---|---|
oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/31409 |
network_acronym_str |
UDEA2 |
network_name_str |
Repositorio UdeA |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Analysis of Pathological Speech Signals |
dc.title.alternative.spa.fl_str_mv |
Análisis de Señales de Voz Patológicas |
title |
Analysis of Pathological Speech Signals |
spellingShingle |
Analysis of Pathological Speech Signals Deep Learning Aprendizaje profundo Parkinson Disease Enfermedad de parkinson Speech Recognition Software Software de Reconocimiento del Habla Cochlear Implants Implantes Cocleares Aging Envejecimiento Machine learning Aprendizaje automático (inteligencia artificial) Speech processing |
title_short |
Analysis of Pathological Speech Signals |
title_full |
Analysis of Pathological Speech Signals |
title_fullStr |
Analysis of Pathological Speech Signals |
title_full_unstemmed |
Analysis of Pathological Speech Signals |
title_sort |
Analysis of Pathological Speech Signals |
dc.creator.fl_str_mv |
Arias Vergara, Tomás |
dc.contributor.advisor.none.fl_str_mv |
Orozco Arroyave, Juan Rafael Nöth, Elmar Schuster, Maria |
dc.contributor.author.none.fl_str_mv |
Arias Vergara, Tomás |
dc.subject.decs.none.fl_str_mv |
Deep Learning Aprendizaje profundo Parkinson Disease Enfermedad de parkinson Speech Recognition Software Software de Reconocimiento del Habla Cochlear Implants Implantes Cocleares Aging Envejecimiento |
topic |
Deep Learning Aprendizaje profundo Parkinson Disease Enfermedad de parkinson Speech Recognition Software Software de Reconocimiento del Habla Cochlear Implants Implantes Cocleares Aging Envejecimiento Machine learning Aprendizaje automático (inteligencia artificial) Speech processing |
dc.subject.lemb.none.fl_str_mv |
Machine learning Aprendizaje automático (inteligencia artificial) |
dc.subject.proposal.spa.fl_str_mv |
Speech processing |
description |
ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings captured in the short-term (4 months) and long-term (5 years). Machine learning methods are used to perform three tasks: (1) automatic classification of patients vs. healthy speakers. (2) regression analysis to predict the dysarthria level and neurological state. (3) speaker embeddings to analyze the progression of the speech symptoms over time. For hearing loss, automatic acoustic analysis is performed to evaluate whether the duration and onset of deafness (before or after speech acquisition) influence the speech production of cochlear implant users. Additionally, articulation, prosody, and phonemic analyses show that cochlear implant users present altered speech production even after hearing rehabilitation. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-10-20T15:01:29Z |
dc.date.available.none.fl_str_mv |
2022-10-20T15:01:29Z |
dc.date.issued.none.fl_str_mv |
2022 |
dc.type.spa.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.type.hasversion.spa.fl_str_mv |
info:eu-repo/semantics/draft |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TD |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Doctorado |
format |
http://purl.org/coar/resource_type/c_db06 |
status_str |
draft |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/10495/31409 |
url |
https://hdl.handle.net/10495/31409 |
dc.language.iso.spa.fl_str_mv |
eng |
language |
eng |
dc.rights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by/2.5/co/ |
dc.rights.accessrights.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/2.5/co/ http://purl.org/coar/access_right/c_abf2 https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.format.extent.spa.fl_str_mv |
221 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.group.spa.fl_str_mv |
Grupo de Investigación en Telecomunicaciones Aplicadas (GITA) |
dc.publisher.place.spa.fl_str_mv |
Medellín - Colombia |
institution |
Universidad de Antioquia |
bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/2/license_rdf https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/3/license.txt https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/1/AriasTomas_2022_AnalysisPathologicalSpeech |
bitstream.checksum.fl_str_mv |
1646d1f6b96dbbbc38035efc9239ac9c 8a4605be74aa9ea9d79846c1fba20a33 13509384c4d67019ce6bc892ed114a8b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad de Antioquia |
repository.mail.fl_str_mv |
andres.perez@udea.edu.co |
_version_ |
1812173197883211776 |
spelling |
Orozco Arroyave, Juan RafaelNöth, ElmarSchuster, MariaArias Vergara, Tomás2022-10-20T15:01:29Z2022-10-20T15:01:29Z2022https://hdl.handle.net/10495/31409ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings captured in the short-term (4 months) and long-term (5 years). Machine learning methods are used to perform three tasks: (1) automatic classification of patients vs. healthy speakers. (2) regression analysis to predict the dysarthria level and neurological state. (3) speaker embeddings to analyze the progression of the speech symptoms over time. For hearing loss, automatic acoustic analysis is performed to evaluate whether the duration and onset of deafness (before or after speech acquisition) influence the speech production of cochlear implant users. Additionally, articulation, prosody, and phonemic analyses show that cochlear implant users present altered speech production even after hearing rehabilitation.RESUMEN : La presente tesis aborda el análisis automático de los trastornos del habla derivados de la enfermedad de Parkinson y la pérdida auditiva. En el caso de la enfermedad de Parkinson, el progreso de los síntomas del habla se evalúa considerando las grabaciones capturadas a corto (4 meses) y largo plazo (5 años). Métodos de aprendizaje automático son utilizados para realizar tres tareas: (1) clasificación automática de pacientes contra a hablantes sanos, (2) análisis de regresión para predecir el nivel de disartria y el estado neurológico, y (3) modelos de hablante para análisis longitudinal del progreso de los desórdenes en la voz. En el caso de la pérdida auditiva, se realiza un análisis acústico automático para evaluar si la duración y el inicio de la sordera (antes o después de la adquisición del habla) influye en la producción del habla de los usuarios de implantes cocleares. Además, se realizan análisis de articulación, prosodia y fonéticos para demostrar que los usuarios de implantes cocleares presentan una producción del habla alterada incluso después de la rehabilitación auditiva. El análisis acústico automático se realiza considerando fonación, articulación, prosodia y características fonéticas. La precisión de la producción de fonemas se caracteriza mediante el cálculo de las probabilidades obtenidas de redes neuronales recurrentes entrenadas en Alemán y Español. El análisis fonético considera tres dimensiones principales: forma de articulación, lugar de articulación y sonorización. Esta tesis también propone una metodología para la detección automática del tiempo de inicio de la voz en consonantes oclusivas sordas. Además, en este trabajo se analiza la influencia de la edad en el análisis acústico. El análisis de regresión se realiza para estimar la edad de una persona utilizando las características de fonación, articulación, prosodia y fonética. También, en esta tesis se considera el uso de smartphones para aplicaciones en el sector médico.221application/pdfenginfo:eu-repo/semantics/draftinfo:eu-repo/semantics/doctoralThesishttp://purl.org/coar/resource_type/c_db06https://purl.org/redcol/resource_type/TDTesis/Trabajo de grado - Monografía - Doctoradohttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/Analysis of Pathological Speech SignalsAnálisis de Señales de Voz PatológicasGrupo de Investigación en Telecomunicaciones Aplicadas (GITA)Medellín - ColombiaDeep LearningAprendizaje profundoParkinson DiseaseEnfermedad de parkinsonSpeech Recognition SoftwareSoftware de Reconocimiento del HablaCochlear ImplantsImplantes CoclearesAgingEnvejecimientoMachine learningAprendizaje automático (inteligencia artificial)Speech processingDoctor en Ingeniería Electrónica y de ComputaciónDoctoradoFacultad de Ingeniería. Doctorado en Ingeniería Electrónica y de ComputaciónUniversidad de AntioquiaCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8927https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/2/license_rdf1646d1f6b96dbbbc38035efc9239ac9cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALAriasTomas_2022_AnalysisPathologicalSpeechAriasTomas_2022_AnalysisPathologicalSpeechTesis doctoralapplication/pdf20118642https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/1/AriasTomas_2022_AnalysisPathologicalSpeech13509384c4d67019ce6bc892ed114a8bMD5110495/31409oai:bibliotecadigital.udea.edu.co:10495/314092022-10-20 10:01:54.914Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |