Detección de eventos sonoros en señales de música usando procesos Gaussianos

En este artículo se propone una metodología para detectar eventos sonoros en señales de música usando procesos Gaussianos. En el algoritmo presentado, las señales de audio de entrada son transformadas a un espacio tiempo-frecuencia utilizando la Transformada de Tiempo Corto de Fourier para obtener e...

Full description

Autores:
Alvarado-Durán, Pablo A.
Álvarez-López, Mauricio A.
Orozco-Gutiérrez, Álvaro A.
Tipo de recurso:
Article of journal
Fecha de publicación:
2011
Institución:
Instituto Tecnológico Metropolitano
Repositorio:
Repositorio ITM
Idioma:
spa
OAI Identifier:
oai:repositorio.itm.edu.co:20.500.12622/918
Acceso en línea:
https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108
http://hdl.handle.net/20.500.12622/918
Palabra clave:
Clasificación con procesos Gaussianos
aprendizaje de máquina supervisado
espectrograma
detección de eventos
señales de música.
Gaussian processes classification
supervised machine learning
spectrogram
event detection
music signals.
Rights
License
Copyright (c) 2017 Tecno Lógicas
id RepoITM2_b8d4f2c06cc9df84c382ccad831522fb
oai_identifier_str oai:repositorio.itm.edu.co:20.500.12622/918
network_acronym_str RepoITM2
network_name_str Repositorio ITM
repository_id_str
dc.title.spa.fl_str_mv Detección de eventos sonoros en señales de música usando procesos Gaussianos
dc.title.alternative.none.fl_str_mv Sound event detection for music signals using gaussian processes
title Detección de eventos sonoros en señales de música usando procesos Gaussianos
spellingShingle Detección de eventos sonoros en señales de música usando procesos Gaussianos
Clasificación con procesos Gaussianos
aprendizaje de máquina supervisado
espectrograma
detección de eventos
señales de música.
Gaussian processes classification
supervised machine learning
spectrogram
event detection
music signals.
title_short Detección de eventos sonoros en señales de música usando procesos Gaussianos
title_full Detección de eventos sonoros en señales de música usando procesos Gaussianos
title_fullStr Detección de eventos sonoros en señales de música usando procesos Gaussianos
title_full_unstemmed Detección de eventos sonoros en señales de música usando procesos Gaussianos
title_sort Detección de eventos sonoros en señales de música usando procesos Gaussianos
dc.creator.fl_str_mv Alvarado-Durán, Pablo A.
Álvarez-López, Mauricio A.
Orozco-Gutiérrez, Álvaro A.
dc.contributor.author.none.fl_str_mv Alvarado-Durán, Pablo A.
Álvarez-López, Mauricio A.
Orozco-Gutiérrez, Álvaro A.
dc.subject.spa.fl_str_mv Clasificación con procesos Gaussianos
aprendizaje de máquina supervisado
espectrograma
detección de eventos
señales de música.
topic Clasificación con procesos Gaussianos
aprendizaje de máquina supervisado
espectrograma
detección de eventos
señales de música.
Gaussian processes classification
supervised machine learning
spectrogram
event detection
music signals.
dc.subject.keywords.eng.fl_str_mv Gaussian processes classification
supervised machine learning
spectrogram
event detection
music signals.
description En este artículo se propone una metodología para detectar eventos sonoros en señales de música usando procesos Gaussianos. En el algoritmo presentado, las señales de audio de entrada son transformadas a un espacio tiempo-frecuencia utilizando la Transformada de Tiempo Corto de Fourier para obtener el espectrograma, cuya dimensión es posteriormente reducida pasando de la frecuencia en escala lineal en Hertz a la escala logarítmica en Mel por medio de un banco de filtros triangulares. Finalmente, se clasifica entre “evento” y “no evento” cada uno de los espectros de tiempo corto contenidos en el espectrograma en escala Mel por medio de un clasificador binario basado en procesos Gaussianos. Como parte del proceso de evaluación, se compara el desempeño de la metodología propuesta con el desempeño de algunas técnicas ampliamente utilizadas para detectar eventos en este tipo de señales. Para tal fin, se implementa en MATLAB® cada una de estas técnicas y se ponen a prueba utilizando dos bases de datos compuestas por segmentos de audio de diferente complejidad; definida por el tipo y cantidad de instrumentos tocados al mismo tiempo. Los resultados indican que la metodología propuesta supera el desempeño de las técnicas hasta ahora planteadas, presentando un mejoramiento en la medida F de 1,66 % para la base de datos uno y de 0,45 % para la base de datos dos. 
publishDate 2011
dc.date.issued.none.fl_str_mv 2011-11-30
dc.date.accessioned.none.fl_str_mv 2019-07-18T14:10:15Z
2019-08-20T15:44:40Z
dc.date.available.none.fl_str_mv 2019-07-18T14:10:15Z
2019-08-20T15:44:40Z
dc.type.none.fl_str_mv info:eu-repo/semantics/article
dc.type.eng.fl_str_mv Research Papers
dc.type.spa.fl_str_mv Artículos de investigación
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_6501
format http://purl.org/coar/resource_type/c_6501
dc.identifier.none.fl_str_mv https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108
10.22430/22565337.108
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12622/918
url https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108
http://hdl.handle.net/20.500.12622/918
identifier_str_mv 10.22430/22565337.108
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108/108
dc.relation.ispartofjournal.none.fl_str_mv TecnoLógicas
dc.rights.spa.fl_str_mv Copyright (c) 2017 Tecno Lógicas
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Copyright (c) 2017 Tecno Lógicas
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Instituto Tecnológico Metropolitano (ITM)
dc.source.none.fl_str_mv 2256-5337
0123-7799
dc.source.eng.fl_str_mv TecnoLógicas; Num. 31 (2013); 93-122
dc.source.spa.fl_str_mv TecnoLógicas; Num. 31 (2013); 93-122
institution Instituto Tecnológico Metropolitano
bitstream.url.fl_str_mv https://dspace-itm.metabuscador.org/bitstreams/d83afb48-a5f6-4766-8ba2-4f323d4b1b7d/download
https://dspace-itm.metabuscador.org/bitstreams/ab900f1a-77d8-4f56-9822-4ff2c29dead8/download
https://dspace-itm.metabuscador.org/bitstreams/420aeb9d-be6f-448e-aba4-69ebe4c1b894/download
bitstream.checksum.fl_str_mv 28c6099ef76aab71d96bd00d67bb081d
8e1660518a284125cf8e3b219dd43a0f
a22b0aba7b0e27955e4f98549933fe5a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Instituto Tecnológico Metropolitano de Medellín
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1837096908819005440
spelling Alvarado-Durán, Pablo A.Álvarez-López, Mauricio A.Orozco-Gutiérrez, Álvaro A.2019-07-18T14:10:15Z2019-08-20T15:44:40Z2019-07-18T14:10:15Z2019-08-20T15:44:40Z2011-11-30https://revistas.itm.edu.co/index.php/tecnologicas/article/view/10810.22430/22565337.108http://hdl.handle.net/20.500.12622/918En este artículo se propone una metodología para detectar eventos sonoros en señales de música usando procesos Gaussianos. En el algoritmo presentado, las señales de audio de entrada son transformadas a un espacio tiempo-frecuencia utilizando la Transformada de Tiempo Corto de Fourier para obtener el espectrograma, cuya dimensión es posteriormente reducida pasando de la frecuencia en escala lineal en Hertz a la escala logarítmica en Mel por medio de un banco de filtros triangulares. Finalmente, se clasifica entre “evento” y “no evento” cada uno de los espectros de tiempo corto contenidos en el espectrograma en escala Mel por medio de un clasificador binario basado en procesos Gaussianos. Como parte del proceso de evaluación, se compara el desempeño de la metodología propuesta con el desempeño de algunas técnicas ampliamente utilizadas para detectar eventos en este tipo de señales. Para tal fin, se implementa en MATLAB® cada una de estas técnicas y se ponen a prueba utilizando dos bases de datos compuestas por segmentos de audio de diferente complejidad; definida por el tipo y cantidad de instrumentos tocados al mismo tiempo. Los resultados indican que la metodología propuesta supera el desempeño de las técnicas hasta ahora planteadas, presentando un mejoramiento en la medida F de 1,66 % para la base de datos uno y de 0,45 % para la base de datos dos. In this paper we present a new methodology for detecting sound events in music signals using Gaussian Processes. Our method firstly takes a time-frequency representation, i.e. the spectrogram, of the input audio signal. Secondly the spectrogram dimension is reduced translating the linear Hertz frequency scale into the logarithmic Mel frequency scale using a triangular filter bank. Finally every short-time spectrum, i.e. every Mel spectrogram column, is classified as “Event” or “Not Event” by a Gaussian Processes Classifier. We compare our method with other event detection techniques widely used. To do so, we use MATLAB® to program each technique and test them using two datasets of music with different levels of complexity. Results show that the new methodology outperforms the standard approaches, getting an improvement by about 1.66 % on the dataset one and 0.45 % on the dataset two in terms of F-measure.application/pdfspaInstituto Tecnológico Metropolitano (ITM)https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108/108TecnoLógicasCopyright (c) 2017 Tecno Lógicashttp://purl.org/coar/access_right/c_abf22256-53370123-7799TecnoLógicas; Num. 31 (2013); 93-122TecnoLógicas; Num. 31 (2013); 93-122Clasificación con procesos Gaussianosaprendizaje de máquina supervisadoespectrogramadetección de eventosseñales de música.Gaussian processes classificationsupervised machine learningspectrogramevent detectionmusic signals.Detección de eventos sonoros en señales de música usando procesos GaussianosSound event detection for music signals using gaussian processesinfo:eu-repo/semantics/articleResearch PapersArtículos de investigaciónhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85PublicationORIGINAL108-Manuscrito-198-1-10-20170208.pdf108-Manuscrito-198-1-10-20170208.pdfapplication/pdf719970https://dspace-itm.metabuscador.org/bitstreams/d83afb48-a5f6-4766-8ba2-4f323d4b1b7d/download28c6099ef76aab71d96bd00d67bb081dMD51trueAnonymousREADTHUMBNAIL108-Manuscrito-198-1-10-20170208.pdf.jpg108-Manuscrito-198-1-10-20170208.pdf.jpgGenerated Thumbnailimage/jpeg4641https://dspace-itm.metabuscador.org/bitstreams/ab900f1a-77d8-4f56-9822-4ff2c29dead8/download8e1660518a284125cf8e3b219dd43a0fMD52falseAnonymousREADTEXT108-Manuscrito-198-1-10-20170208.pdf.txt108-Manuscrito-198-1-10-20170208.pdf.txtExtracted texttext/plain57667https://dspace-itm.metabuscador.org/bitstreams/420aeb9d-be6f-448e-aba4-69ebe4c1b894/downloada22b0aba7b0e27955e4f98549933fe5aMD53falseAnonymousREAD20.500.12622/918oai:dspace-itm.metabuscador.org:20.500.12622/9182025-06-24 09:29:27.217open.accesshttps://dspace-itm.metabuscador.orgRepositorio Instituto Tecnológico Metropolitano de Medellínbdigital@metabiblioteca.com