Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales
En este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en lo...
- Autores:
-
Sepúlveda Cano, Lina María
Quiza Montealegre, Jhon Jair
Gómez García, Jorge Andrés
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2017
- Institución:
- Universidad de Medellín
- Repositorio:
- Repositorio UDEM
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udem.edu.co:11407/3604
- Acceso en línea:
- http://hdl.handle.net/11407/3604
- Palabra clave:
- Remote diagnostics
Voice pathology detection
Voice compression
Biosignals analysis
Telediagnóstico
Detección de patologías de voz
Compresión de voz
Análisis de bioseñales
- Rights
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
id |
REPOUDEM2_fa900d2d7beccca0a5b53827581bc33d |
---|---|
oai_identifier_str |
oai:repository.udem.edu.co:11407/3604 |
network_acronym_str |
REPOUDEM2 |
network_name_str |
Repositorio UDEM |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales Analysis of the influence of signal compression techniques for voice disorder detection through filter-banked based features |
title |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
spellingShingle |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales Remote diagnostics Voice pathology detection Voice compression Biosignals analysis Telediagnóstico Detección de patologías de voz Compresión de voz Análisis de bioseñales |
title_short |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
title_full |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
title_fullStr |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
title_full_unstemmed |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
title_sort |
Análisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocales |
dc.creator.fl_str_mv |
Sepúlveda Cano, Lina María Quiza Montealegre, Jhon Jair Gómez García, Jorge Andrés |
dc.contributor.author.none.fl_str_mv |
Sepúlveda Cano, Lina María Quiza Montealegre, Jhon Jair Gómez García, Jorge Andrés |
dc.subject.spa.fl_str_mv |
Remote diagnostics Voice pathology detection Voice compression Biosignals analysis Telediagnóstico Detección de patologías de voz Compresión de voz Análisis de bioseñales |
topic |
Remote diagnostics Voice pathology detection Voice compression Biosignals analysis Telediagnóstico Detección de patologías de voz Compresión de voz Análisis de bioseñales |
description |
En este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en los sistemas de telefonía fija, móvil e IP, y las técnicas de caracterización y clasificación usadas también están dentro de las más utilizadas para la detección automática de anomalías de voz. Los resultados obtenidos permiten concluir que es posible utilizar señales de voz comprimidas para detección automática de patologías vocales sin detrimento en el porcentaje de acierto en el diagnóstico, lo que haría posible la implementación de sistemas de telediagnóstico automático de patologías vocales. |
publishDate |
2017 |
dc.date.accessioned.none.fl_str_mv |
2017-06-29T22:22:40Z |
dc.date.available.none.fl_str_mv |
2017-06-29T22:22:40Z |
dc.date.created.none.fl_str_mv |
2017-06-30 |
dc.type.eng.fl_str_mv |
Article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.type.local.spa.fl_str_mv |
Artículo científico |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/article |
format |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.issn.none.fl_str_mv |
1692-3324 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/11407/3604 |
dc.identifier.doi.none.fl_str_mv |
http://dx.doi.org/10.22395/rium.v16n30a3 |
dc.identifier.eissn.none.fl_str_mv |
2248-4094 |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad de Medellín |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repository.udem.edu.co/ |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de Medellín |
identifier_str_mv |
1692-3324 http://dx.doi.org/10.22395/rium.v16n30a3 2248-4094 reponame:Repositorio Institucional Universidad de Medellín repourl:https://repository.udem.edu.co/ instname:Universidad de Medellín |
url |
http://hdl.handle.net/11407/3604 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.uri.none.fl_str_mv |
http://revistas.udem.edu.co/index.php/ingenierias/article/view/1511 |
dc.relation.citationvolume.none.fl_str_mv |
16 |
dc.relation.citationissue.none.fl_str_mv |
30 |
dc.relation.citationstartpage.none.fl_str_mv |
49 |
dc.relation.citationendpage.none.fl_str_mv |
66 |
dc.relation.references.spa.fl_str_mv |
S. Kadambe and P. Srinivasan, "Adaptive wavelets for signal classification and compression," AEU-International Journal of Electronics and Communications, vol. 60, pp. 45-55, 2006. G. Rajesh, et al., "Speech compression using different transform techniques," in Computer and Communication Technology (ICCCT), 2011 2nd International Conference on, 2011, pp. 146-151. I. Otung, Communication engineering principles: Palgrave Macmillan, 2001. B. Sklar, Digital communications vol. 2: Prentice Hall NJ, 2001. T. ITU, "Recommendation G. 711," Pulse Code Modulation (PCM) of voice frequencies, November, 1988. R. ITU-T and I. Recommend, "P. 800," Methods for subjective determination of transmission quality, 1996. S. Haykin, Communication systems: John Wiley & Sons, 2008. J. Davidson, Voice over IP fundamentals: Cisco press, 2006. D. Peña, Análisis de datos multivariantes vol. 24: McGraw-Hill Madrid, 2002. J. B. Alonso, et al., "Automatic detection of pathologies in the voice by HOS based parameters," EURASIP Journal on Applied Signal Processing, vol. 4, pp. 275-284, 2001. G. Banci, et al., "Vocal fold disorder evaluation by digital speech analysis," Journal of Phonetics, vol. 14, pp. 495-499, 1986. B. Boyanov and S. Hadjitodorov, "Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases," Engineering in Medicine and Biology Magazine, IEEE, vol. 16, pp. 74-82, 1997. A. A. Dibazar, et al., "Feature analysis for automatic detection of pathological speech," in Engineering in Medicine and Biology, 2002. 24th Annual Conference and the Annual Fall Meeting of the Biomedical Engineering Society EMBS/BMES Conference, 2002. Proceedings of the Second Joint, 2002, pp. 182-183 vol.1. M. K. Arjmandi and M. Pooyan, "An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine," Biomedical Signal Processing and Control, vol. 7, pp. 3-19, 2012. R. J. Moran, et al., "Telephony-based voice pathology assessment using automated speech analysis," Biomedical Engineering, IEEE Transactions on, vol. 53, pp. 468-477, 2006. M. F. Kaleem, et al., "Telephone-quality pathological speech classification using empirical mode decomposition," in Engineering in Medicine and Biology Society, EMBC, 2011 Annual International Conference of the IEEE, 2011, pp. 7095-7098. N. Saenz-Lechon, et al., "Effects of Audio Compression in Automatic Detection of Voice Pathologies," Biomedical Engineering, IEEE Transactions on, vol. 55, pp. 2831-2835, 2008. D. Arifianto, "Enhancement of speech over wireless network using sinusoidal modeling and synthesis," in Signal Processing Systems (SiPS), 2013 IEEE Workshop on, 2013, pp. 301-305. V. Uloza, et al., "Exploring the feasibility of smart phone microphone for measurement of acoustic voice parameters and voice pathology screening," European Archives of Oto-Rhino-Laryngology, pp. 1-9, 2015/07/11 2015. M. Eye and E. Infirmary, "Voice disorders database, version. 1.03 (cd-rom)," Lincoln Park, NJ: Kay Elemetrics Corporation, 1994. G. Smillie, Analogue and digital communication techniques: Butterworth-Heinemann, 1999. S. Karapantazis and F.-N. Pavlidou, "VoIP: A comprehensive survey on a promising technology," Computer Networks, vol. 53, pp. 2050-2090, 2009. A. R. Madane, et al., "Speech compression using Linear predictive coding," in proceedings International workshop on Machine Intelligence Research MIR labs, 2009. M. Hasegawa-Johnson, "Lecture notes in speech production, speech coding, and speech recognition," class notes, University of Illinois at Urbana-Champaign, Fall, 2000. L. M. Sepúlveda Cano, "Análisis Dinámico de Relevancia en Bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2013. A. F. Quiceno Manrique, "Análisis tiempo-frecuencia por métodos no paramétricos orientado a la detección de patologías en bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2009. |
dc.relation.ispartofjournal.spa.fl_str_mv |
Revista Ingenierías Universidad de Medellín |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.creativecommons.*.fl_str_mv |
Attribution-NonCommercial-ShareAlike 4.0 International |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Attribution-NonCommercial-ShareAlike 4.0 International http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.spa.fl_str_mv |
p. 49-66 |
dc.format.medium.spa.fl_str_mv |
Electrónico |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degreesLong: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees |
dc.publisher.spa.fl_str_mv |
Universidad de Medellín |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingenierías |
dc.publisher.place.spa.fl_str_mv |
Medellín |
dc.source.spa.fl_str_mv |
Revista Ingenierías Universidad de Medellín; Vol. 16, núm. 30 (2017); 49-66 2248-4094 1692-3324 |
institution |
Universidad de Medellín |
bitstream.url.fl_str_mv |
http://repository.udem.edu.co/bitstream/11407/3604/3/Revista_Ingenierias_UdeM_300.pdf.jpg http://repository.udem.edu.co/bitstream/11407/3604/1/Articulo.html http://repository.udem.edu.co/bitstream/11407/3604/2/Revista_Ingenierias_UdeM_300.pdf |
bitstream.checksum.fl_str_mv |
6bcd2f386573a1e078c8b6faa7da25bf a8b2c84d6bc9ac0239105c835381aa9e 8b4f0e2292f31520eb8c708150751aaa |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad de Medellin |
repository.mail.fl_str_mv |
repositorio@udem.edu.co |
_version_ |
1814159254871867392 |
spelling |
Sepúlveda Cano, Lina MaríaQuiza Montealegre, Jhon JairGómez García, Jorge AndrésSepúlveda Cano, Lina María; Universidad de MedellínQuiza Montealegre, Jhon Jair; Universidad de MedellínGómez García, Jorge Andrés; Universidad Politécnica de Madrid2017-06-29T22:22:40Z2017-06-29T22:22:40Z2017-06-301692-3324http://hdl.handle.net/11407/3604 http://dx.doi.org/10.22395/rium.v16n30a32248-4094reponame:Repositorio Institucional Universidad de Medellínrepourl:https://repository.udem.edu.co/instname:Universidad de MedellínEn este artículo se comparan los resultados de utilizar señales de voz comprimidas frente a señales de voz sin comprimir para detectar de forma automática anomalías vocales. Las técnicas de codificación y compresión de voz usadas en este estudio son las mismas que se utilizan de forma estándar en los sistemas de telefonía fija, móvil e IP, y las técnicas de caracterización y clasificación usadas también están dentro de las más utilizadas para la detección automática de anomalías de voz. Los resultados obtenidos permiten concluir que es posible utilizar señales de voz comprimidas para detección automática de patologías vocales sin detrimento en el porcentaje de acierto en el diagnóstico, lo que haría posible la implementación de sistemas de telediagnóstico automático de patologías vocales.This paper compares the results of using compressed voice signals versus uncompressed speech signals to automatically detect voice abnormalities. Coding techniques and voice compression used in this study are the same as those used by default in the fixed, mobile and ip telephony systems, and techniques of characterization and classification used are also among the most used for detecting automatic speech abnormalities. The results obtained indicate that it is possible to use compressed voice signals for automatic detection of vocal pathologies without compromising the success rate in the diagnosis, which would make the implementation of automatic remote diagnosis of vocal pathologies possible.p. 49-66Electrónicoapplication/pdfspaUniversidad de MedellínFacultad de IngenieríasMedellínhttp://revistas.udem.edu.co/index.php/ingenierias/article/view/151116304966S. Kadambe and P. Srinivasan, "Adaptive wavelets for signal classification and compression," AEU-International Journal of Electronics and Communications, vol. 60, pp. 45-55, 2006.G. Rajesh, et al., "Speech compression using different transform techniques," in Computer and Communication Technology (ICCCT), 2011 2nd International Conference on, 2011, pp. 146-151.I. Otung, Communication engineering principles: Palgrave Macmillan, 2001.B. Sklar, Digital communications vol. 2: Prentice Hall NJ, 2001.T. ITU, "Recommendation G. 711," Pulse Code Modulation (PCM) of voice frequencies, November, 1988.R. ITU-T and I. Recommend, "P. 800," Methods for subjective determination of transmission quality, 1996.S. Haykin, Communication systems: John Wiley & Sons, 2008.J. Davidson, Voice over IP fundamentals: Cisco press, 2006.D. Peña, Análisis de datos multivariantes vol. 24: McGraw-Hill Madrid, 2002.J. B. Alonso, et al., "Automatic detection of pathologies in the voice by HOS based parameters," EURASIP Journal on Applied Signal Processing, vol. 4, pp. 275-284, 2001.G. Banci, et al., "Vocal fold disorder evaluation by digital speech analysis," Journal of Phonetics, vol. 14, pp. 495-499, 1986.B. Boyanov and S. Hadjitodorov, "Acoustic analysis of pathological voices. A voice analysis system for the screening of laryngeal diseases," Engineering in Medicine and Biology Magazine, IEEE, vol. 16, pp. 74-82, 1997.A. A. Dibazar, et al., "Feature analysis for automatic detection of pathological speech," in Engineering in Medicine and Biology, 2002. 24th Annual Conference and the Annual Fall Meeting of the Biomedical Engineering Society EMBS/BMES Conference, 2002. Proceedings of the Second Joint, 2002, pp. 182-183 vol.1.M. K. Arjmandi and M. Pooyan, "An optimum algorithm in pathological voice quality assessment using wavelet-packet-based features, linear discriminant analysis and support vector machine," Biomedical Signal Processing and Control, vol. 7, pp. 3-19, 2012.R. J. Moran, et al., "Telephony-based voice pathology assessment using automated speech analysis," Biomedical Engineering, IEEE Transactions on, vol. 53, pp. 468-477, 2006.M. F. Kaleem, et al., "Telephone-quality pathological speech classification using empirical mode decomposition," in Engineering in Medicine and Biology Society, EMBC, 2011 Annual International Conference of the IEEE, 2011, pp. 7095-7098.N. Saenz-Lechon, et al., "Effects of Audio Compression in Automatic Detection of Voice Pathologies," Biomedical Engineering, IEEE Transactions on, vol. 55, pp. 2831-2835, 2008.D. Arifianto, "Enhancement of speech over wireless network using sinusoidal modeling and synthesis," in Signal Processing Systems (SiPS), 2013 IEEE Workshop on, 2013, pp. 301-305.V. Uloza, et al., "Exploring the feasibility of smart phone microphone for measurement of acoustic voice parameters and voice pathology screening," European Archives of Oto-Rhino-Laryngology, pp. 1-9, 2015/07/11 2015.M. Eye and E. Infirmary, "Voice disorders database, version. 1.03 (cd-rom)," Lincoln Park, NJ: Kay Elemetrics Corporation, 1994.G. Smillie, Analogue and digital communication techniques: Butterworth-Heinemann, 1999.S. Karapantazis and F.-N. Pavlidou, "VoIP: A comprehensive survey on a promising technology," Computer Networks, vol. 53, pp. 2050-2090, 2009.A. R. Madane, et al., "Speech compression using Linear predictive coding," in proceedings International workshop on Machine Intelligence Research MIR labs, 2009.M. Hasegawa-Johnson, "Lecture notes in speech production, speech coding, and speech recognition," class notes, University of Illinois at Urbana-Champaign, Fall, 2000.L. M. Sepúlveda Cano, "Análisis Dinámico de Relevancia en Bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2013.A. F. Quiceno Manrique, "Análisis tiempo-frecuencia por métodos no paramétricos orientado a la detección de patologías en bioseñales," Universidad Nacional de Colombia-Sede Manizales, 2009.Revista Ingenierías Universidad de Medellínhttp://creativecommons.org/licenses/by-nc-sa/4.0/Attribution-NonCommercial-ShareAlike 4.0 Internationalhttp://purl.org/coar/access_right/c_abf2Revista Ingenierías Universidad de Medellín; Vol. 16, núm. 30 (2017); 49-662248-40941692-3324Remote diagnosticsVoice pathology detectionVoice compressionBiosignals analysisTelediagnósticoDetección de patologías de vozCompresión de vozAnálisis de bioseñalesAnálisis de la influencia de las técnicas de compresión de voz en la detección de anomalías vocalesAnalysis of the influence of signal compression techniques for voice disorder detection through filter-banked based featuresArticlehttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1Artículo científicoinfo:eu-repo/semantics/articlehttp://purl.org/coar/version/c_970fb48d4fbd8a85Comunidad Universidad de MedellínLat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degreesLong: 075 36 00 W degrees minutes Long: -75.6000 decimal degreesTHUMBNAILRevista_Ingenierias_UdeM_300.pdf.jpgRevista_Ingenierias_UdeM_300.pdf.jpgIM Thumbnailimage/jpeg7691http://repository.udem.edu.co/bitstream/11407/3604/3/Revista_Ingenierias_UdeM_300.pdf.jpg6bcd2f386573a1e078c8b6faa7da25bfMD53ORIGINALArticulo.htmltext/html497http://repository.udem.edu.co/bitstream/11407/3604/1/Articulo.htmla8b2c84d6bc9ac0239105c835381aa9eMD51Revista_Ingenierias_UdeM_300.pdfRevista_Ingenierias_UdeM_300.pdfapplication/pdf882441http://repository.udem.edu.co/bitstream/11407/3604/2/Revista_Ingenierias_UdeM_300.pdf8b4f0e2292f31520eb8c708150751aaaMD5211407/3604oai:repository.udem.edu.co:11407/36042021-05-14 14:29:22.004Repositorio Institucional Universidad de Medellinrepositorio@udem.edu.co |