Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales

En este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en lo...

Full description

Autores:
Sepúlveda Cano, Lina María
Quiza Montealegre, Jhon Jair
Gómez García, Jorge Andrés
Tipo de recurso:
Article of journal
Fecha de publicación:
2017
Institución:
Universidad de Medellín
Repositorio:
Repositorio UDEM
Idioma:
spa
OAI Identifier:
oai:repository.udem.edu.co:11407/3604
Acceso en línea:
http://hdl.handle.net/11407/3604
Palabra clave:
Remote diagnostics
Voice pathology detection
Voice compression
Biosignals analysis
Telediagnóstico
Detección de patologías de voz
Compresión de voz
Análisis de bioseñales
Rights
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
id REPOUDEM2_fa900d2d7beccca0a5b53827581bc33d
oai_identifier_str oai:repository.udem.edu.co:11407/3604
network_acronym_str REPOUDEM2
network_name_str Repositorio UDEM
repository_id_str
dc.title.spa.fl_str_mv Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
Analysis of the influence of signal compression techniques for voice disorder detection through filter-banked based features
title Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
spellingShingle Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
Remote diagnostics
Voice pathology detection
Voice compression
Biosignals analysis
Telediagnóstico
Detección de patologías de voz
Compresión de voz
Análisis de bioseñales
title_short Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
title_full Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
title_fullStr Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
title_full_unstemmed Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
title_sort Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
dc.creator.fl_str_mv Sepúlveda Cano, Lina María
Quiza Montealegre, Jhon Jair
Gómez García, Jorge Andrés
dc.contributor.author.none.fl_str_mv Sepúlveda Cano, Lina María
Quiza Montealegre, Jhon Jair
Gómez García, Jorge Andrés
dc.subject.spa.fl_str_mv Remote diagnostics
Voice pathology detection
Voice compression
Biosignals analysis
Telediagnóstico
Detección de patologías de voz
Compresión de voz
Análisis de bioseñales
topic Remote diagnostics
Voice pathology detection
Voice compression
Biosignals analysis
Telediagnóstico
Detección de patologías de voz
Compresión de voz
Análisis de bioseñales
description En este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en los sistemas de telefonía fija, móvil e IP, y las técnicas de caracterización y clasificación usadas también están dentro de las más utilizadas para la detección automática de anomalías de voz. Los resultados obtenidos permiten concluir que es posible utilizar señales de voz comprimidas para detección automática de patologías vocales sin detrimento en el porcentaje de acierto en el diagnóstico, lo que haría posible la implementación de sistemas de telediagnóstico automático de patologías vocales.
publishDate 2017
dc.date.accessioned.none.fl_str_mv 2017-06-29T22:22:40Z
dc.date.available.none.fl_str_mv 2017-06-29T22:22:40Z
dc.date.created.none.fl_str_mv 2017-06-30
dc.type.eng.fl_str_mv Article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.local.spa.fl_str_mv Artículo científico
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/article
format http://purl.org/coar/resource_type/c_6501
dc.identifier.issn.none.fl_str_mv 1692-3324
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11407/3604
dc.identifier.doi.none.fl_str_mv  http://dx.doi.org/10.22395/rium.v16n30a3
dc.identifier.eissn.none.fl_str_mv 2248-4094
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad de Medellín
dc.identifier.repourl.none.fl_str_mv repourl:https://repository.udem.edu.co/
dc.identifier.instname.spa.fl_str_mv instname:Universidad de Medellín
identifier_str_mv 1692-3324
 http://dx.doi.org/10.22395/rium.v16n30a3
2248-4094
reponame:Repositorio Institucional Universidad de Medellín
repourl:https://repository.udem.edu.co/
instname:Universidad de Medellín
url http://hdl.handle.net/11407/3604
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.uri.none.fl_str_mv http://revistas.udem.edu.co/index.php/ingenierias/article/view/1511
dc.relation.citationvolume.none.fl_str_mv 16
dc.relation.citationissue.none.fl_str_mv 30
dc.relation.citationstartpage.none.fl_str_mv 49
dc.relation.citationendpage.none.fl_str_mv 66
dc.relation.references.spa.fl_str_mv S. Kadambe and P. Srinivasan, "Adaptive wavelets for signal classification and compression," AEU-International Journal of Electronics and Communications, vol. 60, pp. 45-55, 2006.
G. Rajesh, et al., "Speech compression using different transform techniques," in Computer and Communication Technology (ICCCT), 2011 2nd International Conference on, 2011, pp. 146-151.
I. Otung, Communication engineering principles: Palgrave Macmillan, 2001.
B. Sklar, Digital communications vol. 2: Prentice Hall NJ, 2001.
T. ITU, "Recommendation G. 711," Pulse Code Modulation (PCM) of voice frequencies, November, 1988.
R. ITU-T and I. Recommend, "P. 800," Methods for subjective determination of transmission quality, 1996.
S. Haykin, Communication systems: John Wiley & Sons, 2008.
J. Davidson, Voice over IP fundamentals: Cisco press, 2006.
D. Peña, Análisis de datos multivariantes vol. 24: McGraw-Hill Madrid, 2002.
J. B. Alonso, et al., "Automatic detection of pathologies in the voice by HOS based parameters," EURASIP Journal on Applied Signal Processing, vol. 4, pp. 275-284, 2001.
G. Banci, et al., "Vocal fold disorder evaluation by digital speech analysis," Journal of Phonetics, vol. 14, pp. 495-499, 1986.
B. Boyanov and S. Hadjitodorov, "Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases," Engineering in Medicine and Biology Magazine, IEEE, vol. 16, pp. 74-82, 1997.
A. A. Dibazar, et al., "Feature analysis for automatic detection of pathological speech," in Engineering in Medicine and Biology, 2002. 24th Annual Conference and the Annual Fall Meeting of the Biomedical Engineering Society EMBS/BMES Conference, 2002. Proceedings of the Second Joint, 2002, pp. 182-183 vol.1.
M. K. Arjmandi and M. Pooyan, "An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine," Biomedical Signal Processing and Control, vol. 7, pp. 3-19, 2012.
R. J. Moran, et al., "Telephony-based voice pathology assessment using automated speech analysis," Biomedical Engineering, IEEE Transactions on, vol. 53, pp. 468-477, 2006.
M. F. Kaleem, et al., "Telephone-quality pathological speech classification using empirical mode decomposition," in Engineering in Medicine and Biology Society, EMBC, 2011 Annual International Conference of the IEEE, 2011, pp. 7095-7098.
N. Saenz-Lechon, et al., "Effects of Audio Compression in Automatic Detection of Voice Pathologies," Biomedical Engineering, IEEE Transactions on, vol. 55, pp. 2831-2835, 2008.
D. Arifianto, "Enhancement of speech over wireless network using sinusoidal modeling and synthesis," in Signal Processing Systems (SiPS), 2013 IEEE Workshop on, 2013, pp. 301-305.
V. Uloza, et al., "Exploring the feasibility of smart phone microphone for measurement of acoustic voice parameters and voice pathology screening," European Archives of Oto-Rhino-Laryngology, pp. 1-9, 2015/07/11 2015.
M. Eye and E. Infirmary, "Voice disorders database, version. 1.03 (cd-rom)," Lincoln Park, NJ: Kay Elemetrics Corporation, 1994.
G. Smillie, Analogue and digital communication techniques: Butterworth-Heinemann, 1999.
S. Karapantazis and F.-N. Pavlidou, "VoIP: A comprehensive survey on a promising technology," Computer Networks, vol. 53, pp. 2050-2090, 2009.
A. R. Madane, et al., "Speech compression using Linear predictive coding," in proceedings International workshop on Machine Intelligence Research MIR labs, 2009.
M. Hasegawa-Johnson, "Lecture notes in speech production, speech coding, and speech recognition," class notes, University of Illinois at Urbana-Champaign, Fall, 2000.
L. M. Sepúlveda Cano, "Análisis Dinámico de Relevancia en Bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2013.
A. F. Quiceno Manrique, "Análisis tiempo-frecuencia por métodos no paramétricos orientado a la detección de patologías en bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2009.
dc.relation.ispartofjournal.spa.fl_str_mv Revista Ingenierías Universidad de Medellín
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.creativecommons.*.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Attribution-NonCommercial-ShareAlike 4.0 International
http://purl.org/coar/access_right/c_abf2
dc.format.extent.spa.fl_str_mv p. 49-66
dc.format.medium.spa.fl_str_mv Electrónico
dc.format.mimetype.none.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Lat: 06 15 00 N  degrees minutes  Lat: 6.2500  decimal degreesLong: 075 36 00 W  degrees minutes  Long: -75.6000  decimal degrees
dc.publisher.spa.fl_str_mv Universidad de Medellín
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingenierías
dc.publisher.place.spa.fl_str_mv Medellín
dc.source.spa.fl_str_mv Revista Ingenierías Universidad de Medellín; Vol. 16, núm. 30 (2017); 49-66
2248-4094
1692-3324
institution Universidad de Medellín
bitstream.url.fl_str_mv http://repository.udem.edu.co/bitstream/11407/3604/3/Revista_Ingenierias_UdeM_300.pdf.jpg
http://repository.udem.edu.co/bitstream/11407/3604/1/Articulo.html
http://repository.udem.edu.co/bitstream/11407/3604/2/Revista_Ingenierias_UdeM_300.pdf
bitstream.checksum.fl_str_mv 6bcd2f386573a1e078c8b6faa7da25bf
a8b2c84d6bc9ac0239105c835381aa9e
8b4f0e2292f31520eb8c708150751aaa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Medellin
repository.mail.fl_str_mv repositorio@udem.edu.co
_version_ 1814159254871867392
spelling Sepúlveda Cano, Lina MaríaQuiza Montealegre, Jhon JairGómez García, Jorge AndrésSepúlveda Cano, Lina María; Universidad de MedellínQuiza Montealegre, Jhon Jair; Universidad de MedellínGómez García, Jorge Andrés; Universidad Politécnica de Madrid2017-06-29T22:22:40Z2017-06-29T22:22:40Z2017-06-301692-3324http://hdl.handle.net/11407/3604 http://dx.doi.org/10.22395/rium.v16n30a32248-4094reponame:Repositorio Institucional Universidad de Medellínrepourl:https://repository.udem.edu.co/instname:Universidad de MedellínEn este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en los sistemas de telefonía fija, móvil e IP, y las técnicas de caracterización y clasificación usadas también están dentro de las más utilizadas para la detección automática de anomalías de voz. Los resultados obtenidos permiten concluir que es posible utilizar señales de voz comprimidas para detección automática de patologías vocales sin detrimento en el porcentaje de acierto en el diagnóstico, lo que haría posible la implementación de sistemas de telediagnóstico automático de patologías vocales.This paper compares the results of using compressed voice signals versus uncompressed speech signals to automatically detect voice abnormalities. Coding techniques and voice compression used in this study are the same as those used by default in the fixed, mobile and ip telephony systems, and techniques of characterization and classification used are also among the most used for detecting automatic speech abnormalities. The results obtained indicate that it is possible to use compressed voice signals for automatic detection of vocal pathologies without compromising the success rate in the diagnosis, which would make the implementation of automatic remote diagnosis of vocal pathologies possible.p. 49-66Electrónicoapplication/pdfspaUniversidad de MedellínFacultad de IngenieríasMedellínhttp://revistas.udem.edu.co/index.php/ingenierias/article/view/151116304966S. Kadambe and P. Srinivasan, "Adaptive wavelets for signal classification and compression," AEU-International Journal of Electronics and Communications, vol. 60, pp. 45-55, 2006.G. Rajesh, et al., "Speech compression using different transform techniques," in Computer and Communication Technology (ICCCT), 2011 2nd International Conference on, 2011, pp. 146-151.I. Otung, Communication engineering principles: Palgrave Macmillan, 2001.B. Sklar, Digital communications vol. 2: Prentice Hall NJ, 2001.T. ITU, "Recommendation G. 711," Pulse Code Modulation (PCM) of voice frequencies, November, 1988.R. ITU-T and I. Recommend, "P. 800," Methods for subjective determination of transmission quality, 1996.S. Haykin, Communication systems: John Wiley & Sons, 2008.J. Davidson, Voice over IP fundamentals: Cisco press, 2006.D. Peña, Análisis de datos multivariantes vol. 24: McGraw-Hill Madrid, 2002.J. B. Alonso, et al., "Automatic detection of pathologies in the voice by HOS based parameters," EURASIP Journal on Applied Signal Processing, vol. 4, pp. 275-284, 2001.G. Banci, et al., "Vocal fold disorder evaluation by digital speech analysis," Journal of Phonetics, vol. 14, pp. 495-499, 1986.B. Boyanov and S. Hadjitodorov, "Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases," Engineering in Medicine and Biology Magazine, IEEE, vol. 16, pp. 74-82, 1997.A. A. Dibazar, et al., "Feature analysis for automatic detection of pathological speech," in Engineering in Medicine and Biology, 2002. 24th Annual Conference and the Annual Fall Meeting of the Biomedical Engineering Society EMBS/BMES Conference, 2002. Proceedings of the Second Joint, 2002, pp. 182-183 vol.1.M. K. Arjmandi and M. Pooyan, "An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine," Biomedical Signal Processing and Control, vol. 7, pp. 3-19, 2012.R. J. Moran, et al., "Telephony-based voice pathology assessment using automated speech analysis," Biomedical Engineering, IEEE Transactions on, vol. 53, pp. 468-477, 2006.M. F. Kaleem, et al., "Telephone-quality pathological speech classification using empirical mode decomposition," in Engineering in Medicine and Biology Society, EMBC, 2011 Annual International Conference of the IEEE, 2011, pp. 7095-7098.N. Saenz-Lechon, et al., "Effects of Audio Compression in Automatic Detection of Voice Pathologies," Biomedical Engineering, IEEE Transactions on, vol. 55, pp. 2831-2835, 2008.D. Arifianto, "Enhancement of speech over wireless network using sinusoidal modeling and synthesis," in Signal Processing Systems (SiPS), 2013 IEEE Workshop on, 2013, pp. 301-305.V. Uloza, et al., "Exploring the feasibility of smart phone microphone for measurement of acoustic voice parameters and voice pathology screening," European Archives of Oto-Rhino-Laryngology, pp. 1-9, 2015/07/11 2015.M. Eye and E. Infirmary, "Voice disorders database, version. 1.03 (cd-rom)," Lincoln Park, NJ: Kay Elemetrics Corporation, 1994.G. Smillie, Analogue and digital communication techniques: Butterworth-Heinemann, 1999.S. Karapantazis and F.-N. Pavlidou, "VoIP: A comprehensive survey on a promising technology," Computer Networks, vol. 53, pp. 2050-2090, 2009.A. R. Madane, et al., "Speech compression using Linear predictive coding," in proceedings International workshop on Machine Intelligence Research MIR labs, 2009.M. Hasegawa-Johnson, "Lecture notes in speech production, speech coding, and speech recognition," class notes, University of Illinois at Urbana-Champaign, Fall, 2000.L. M. Sepúlveda Cano, "Análisis Dinámico de Relevancia en Bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2013.A. F. Quiceno Manrique, "Análisis tiempo-frecuencia por métodos no paramétricos orientado a la detección de patologías en bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2009.Revista Ingenierías Universidad de Medellínhttp://creativecommons.org/licenses/by-nc-sa/4.0/Attribution-NonCommercial-ShareAlike 4.0 Internationalhttp://purl.org/coar/access_right/c_abf2Revista Ingenierías Universidad de Medellín; Vol. 16, núm. 30 (2017); 49-662248-40941692-3324Remote diagnosticsVoice pathology detectionVoice compressionBiosignals analysisTelediagnósticoDetección de patologías de vozCompresión de vozAnálisis de bioseñalesAnálisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocalesAnalysis of the influence of signal compression techniques for voice disorder detection through filter-banked based featuresArticlehttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1Artículo científicoinfo:eu-repo/semantics/articlehttp://purl.org/coar/version/c_970fb48d4fbd8a85Comunidad Universidad de MedellínLat: 06 15 00 N  degrees minutes  Lat: 6.2500  decimal degreesLong: 075 36 00 W  degrees minutes  Long: -75.6000  decimal degreesTHUMBNAILRevista_Ingenierias_UdeM_300.pdf.jpgRevista_Ingenierias_UdeM_300.pdf.jpgIM Thumbnailimage/jpeg7691http://repository.udem.edu.co/bitstream/11407/3604/3/Revista_Ingenierias_UdeM_300.pdf.jpg6bcd2f386573a1e078c8b6faa7da25bfMD53ORIGINALArticulo.htmltext/html497http://repository.udem.edu.co/bitstream/11407/3604/1/Articulo.htmla8b2c84d6bc9ac0239105c835381aa9eMD51Revista_Ingenierias_UdeM_300.pdfRevista_Ingenierias_UdeM_300.pdfapplication/pdf882441http://repository.udem.edu.co/bitstream/11407/3604/2/Revista_Ingenierias_UdeM_300.pdf8b4f0e2292f31520eb8c708150751aaaMD5211407/3604oai:repository.udem.edu.co:11407/36042021-05-14 14:29:22.004Repositorio Institucional Universidad de Medellinrepositorio@udem.edu.co