Analysis of Pathological Speech Signals

ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings cap...

Full description

Autores:
Arias Vergara, Tomás
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2022
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
eng
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/31409
Acceso en línea:
https://hdl.handle.net/10495/31409
Palabra clave:
Deep Learning
Aprendizaje profundo
Parkinson Disease
Enfermedad de parkinson
Speech Recognition Software
Software de Reconocimiento del Habla
Cochlear Implants
Implantes Cocleares
Aging
Envejecimiento
Machine learning
Aprendizaje automático (inteligencia artificial)
Speech processing
Rights
openAccess
License
http://creativecommons.org/licenses/by/2.5/co/
id UDEA2_7d5fe46c9ca91e0d9b6885954f2c1f98
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/31409
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Analysis of Pathological Speech Signals
dc.title.alternative.spa.fl_str_mv Análisis de Señales de Voz Patológicas
title Analysis of Pathological Speech Signals
spellingShingle Analysis of Pathological Speech Signals
Deep Learning
Aprendizaje profundo
Parkinson Disease
Enfermedad de parkinson
Speech Recognition Software
Software de Reconocimiento del Habla
Cochlear Implants
Implantes Cocleares
Aging
Envejecimiento
Machine learning
Aprendizaje automático (inteligencia artificial)
Speech processing
title_short Analysis of Pathological Speech Signals
title_full Analysis of Pathological Speech Signals
title_fullStr Analysis of Pathological Speech Signals
title_full_unstemmed Analysis of Pathological Speech Signals
title_sort Analysis of Pathological Speech Signals
dc.creator.fl_str_mv Arias Vergara, Tomás
dc.contributor.advisor.none.fl_str_mv Orozco Arroyave, Juan Rafael
Nöth, Elmar
Schuster, Maria
dc.contributor.author.none.fl_str_mv Arias Vergara, Tomás
dc.subject.decs.none.fl_str_mv Deep Learning
Aprendizaje profundo
Parkinson Disease
Enfermedad de parkinson
Speech Recognition Software
Software de Reconocimiento del Habla
Cochlear Implants
Implantes Cocleares
Aging
Envejecimiento
topic Deep Learning
Aprendizaje profundo
Parkinson Disease
Enfermedad de parkinson
Speech Recognition Software
Software de Reconocimiento del Habla
Cochlear Implants
Implantes Cocleares
Aging
Envejecimiento
Machine learning
Aprendizaje automático (inteligencia artificial)
Speech processing
dc.subject.lemb.none.fl_str_mv Machine learning
Aprendizaje automático (inteligencia artificial)
dc.subject.proposal.spa.fl_str_mv Speech processing
description ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings captured in the short-term (4 months) and long-term (5 years). Machine learning methods are used to perform three tasks: (1) automatic classification of patients vs. healthy speakers. (2) regression analysis to predict the dysarthria level and neurological state. (3) speaker embeddings to analyze the progression of the speech symptoms over time. For hearing loss, automatic acoustic analysis is performed to evaluate whether the duration and onset of deafness (before or after speech acquisition) influence the speech production of cochlear implant users. Additionally, articulation, prosody, and phonemic analyses show that cochlear implant users present altered speech production even after hearing rehabilitation.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-10-20T15:01:29Z
dc.date.available.none.fl_str_mv 2022-10-20T15:01:29Z
dc.date.issued.none.fl_str_mv 2022
dc.type.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/draft
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TD
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Doctorado
format http://purl.org/coar/resource_type/c_db06
status_str draft
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/31409
url https://hdl.handle.net/10495/31409
dc.language.iso.spa.fl_str_mv eng
language eng
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/2.5/co/
dc.rights.accessrights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/2.5/co/
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.extent.spa.fl_str_mv 221
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.group.spa.fl_str_mv Grupo de Investigación en Telecomunicaciones Aplicadas (GITA)
dc.publisher.place.spa.fl_str_mv Medellín - Colombia
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/2/license_rdf
https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/3/license.txt
https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/1/AriasTomas_2022_AnalysisPathologicalSpeech
bitstream.checksum.fl_str_mv 1646d1f6b96dbbbc38035efc9239ac9c
8a4605be74aa9ea9d79846c1fba20a33
13509384c4d67019ce6bc892ed114a8b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Antioquia
repository.mail.fl_str_mv andres.perez@udea.edu.co
_version_ 1812173197883211776
spelling Orozco Arroyave, Juan RafaelNöth, ElmarSchuster, MariaArias Vergara, Tomás2022-10-20T15:01:29Z2022-10-20T15:01:29Z2022https://hdl.handle.net/10495/31409ABSTRACT : This thesis addresses the automatic analysis of speech disorders resulting from a clinical condition (Parkinson's disease and hearing loss) or the natural aging process. For Parkinson's disease, the progression of speech symptoms is evaluated by considering speech recordings captured in the short-term (4 months) and long-term (5 years). Machine learning methods are used to perform three tasks: (1) automatic classification of patients vs. healthy speakers. (2) regression analysis to predict the dysarthria level and neurological state. (3) speaker embeddings to analyze the progression of the speech symptoms over time. For hearing loss, automatic acoustic analysis is performed to evaluate whether the duration and onset of deafness (before or after speech acquisition) influence the speech production of cochlear implant users. Additionally, articulation, prosody, and phonemic analyses show that cochlear implant users present altered speech production even after hearing rehabilitation.RESUMEN : La presente tesis aborda el análisis automático de los trastornos del habla derivados de la enfermedad de Parkinson y la pérdida auditiva. En el caso de la enfermedad de Parkinson, el progreso de los síntomas del habla se evalúa considerando las grabaciones capturadas a corto (4 meses) y largo plazo (5 años). Métodos de aprendizaje automático son utilizados para realizar tres tareas: (1) clasificación automática de pacientes contra a hablantes sanos, (2) análisis de regresión para predecir el nivel de disartria y el estado neurológico, y (3) modelos de hablante para análisis longitudinal del progreso de los desórdenes en la voz. En el caso de la pérdida auditiva, se realiza un análisis acústico automático para evaluar si la duración y el inicio de la sordera (antes o después de la adquisición del habla) influye en la producción del habla de los usuarios de implantes cocleares. Además, se realizan análisis de articulación, prosodia y fonéticos para demostrar que los usuarios de implantes cocleares presentan una producción del habla alterada incluso después de la rehabilitación auditiva. El análisis acústico automático se realiza considerando fonación, articulación, prosodia y características fonéticas. La precisión de la producción de fonemas se caracteriza mediante el cálculo de las probabilidades obtenidas de redes neuronales recurrentes entrenadas en Alemán y Español. El análisis fonético considera tres dimensiones principales: forma de articulación, lugar de articulación y sonorización. Esta tesis también propone una metodología para la detección automática del tiempo de inicio de la voz en consonantes oclusivas sordas. Además, en este trabajo se analiza la influencia de la edad en el análisis acústico. El análisis de regresión se realiza para estimar la edad de una persona utilizando las características de fonación, articulación, prosodia y fonética. También, en esta tesis se considera el uso de smartphones para aplicaciones en el sector médico.221application/pdfenginfo:eu-repo/semantics/draftinfo:eu-repo/semantics/doctoralThesishttp://purl.org/coar/resource_type/c_db06https://purl.org/redcol/resource_type/TDTesis/Trabajo de grado - Monografía - Doctoradohttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/Analysis of Pathological Speech SignalsAnálisis de Señales de Voz PatológicasGrupo de Investigación en Telecomunicaciones Aplicadas (GITA)Medellín - ColombiaDeep LearningAprendizaje profundoParkinson DiseaseEnfermedad de parkinsonSpeech Recognition SoftwareSoftware de Reconocimiento del HablaCochlear ImplantsImplantes CoclearesAgingEnvejecimientoMachine learningAprendizaje automático (inteligencia artificial)Speech processingDoctor en Ingeniería Electrónica y de ComputaciónDoctoradoFacultad de Ingeniería. Doctorado en Ingeniería Electrónica y de ComputaciónUniversidad de AntioquiaCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8927https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/2/license_rdf1646d1f6b96dbbbc38035efc9239ac9cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALAriasTomas_2022_AnalysisPathologicalSpeechAriasTomas_2022_AnalysisPathologicalSpeechTesis doctoralapplication/pdf20118642https://bibliotecadigital.udea.edu.co/bitstream/10495/31409/1/AriasTomas_2022_AnalysisPathologicalSpeech13509384c4d67019ce6bc892ed114a8bMD5110495/31409oai:bibliotecadigital.udea.edu.co:10495/314092022-10-20 10:01:54.914Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=