System for the measurement of musical similarity, using expressive markers considering the acoustic intensity and temporal metrics.

La comprensión sobre el concepto de música puede llevar a discusiones relacionadas con la estructura musical, clasificación y problemas semánticos, porque la idea simple de la música en sí misma puede ser abstracta. Dada esta complejidad, han surgido múltiples temáticas de investigación, siendo una...

Full description

Autores:
Jimenez Medina, Mauro Alejandro
López Miranda, Juan Sebastián
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/8500
Acceso en línea:
http://hdl.handle.net/10584/8500
Palabra clave:
temporary metrics, expressive parameters, spectrogram, discrete cosine transform, Pearson correlation coefficient.
métricas temporales, marcadores expresivos, espectrograma, transformada discreta del coseno, coeficiente de correlación de Pearson.
Rights
License
Universidad del Norte
Description
Summary:La comprensión sobre el concepto de música puede llevar a discusiones relacionadas con la estructura musical, clasificación y problemas semánticos, porque la idea simple de la música en sí misma puede ser abstracta. Dada esta complejidad, han surgido múltiples temáticas de investigación, siendo una de ellas la identificación de audio para garantizar su legitimidad o fraudulencia; pero ¿cómo garantizar la identificación de marcadores expresivos de forma objetiva? Por ello el sistema propuesto actuaría como agente inteligente de control en casos de plagio usando marcadores expresivos, la transformada discreta del coseno y el coeficiente de correlación de Pearson para su desarrollo. La metodología para desarrollar la métrica de similitud musical se describe en la siguiente serie de etapas. La etapa inicial 1 consiste en la lectura y el almacenamiento de la señal de audio o de varias señales de consulta para automatizar la tarea de consulta con el fin de otorgar flexibilidad al usuario; En la etapa 2, el preprocesamiento de la señal se realiza normalizándolo con respecto a los niveles de intensidad acústica en la escala logarítmica descrita por ISO 6926: 2016, luego se realiza un submuestreo de la señal a 44.1 KHz, esta opción está relacionada con La frecuencia máxima permitida por el teorema de Nyquist y, finalmente, la información de los canales se promedia para convertir la muestra de audio en una señal monofónica.   Durante la etapa 3 y 4 se realiza el procesamiento de la señal, este paso consiste en un análisis de frecuencia y temporal de la señal para generar una lista de candidatos utilizando el espectrograma de audio. La etapa 5 consiste en el desarrollo de un algoritmo de similitud que utiliza la transformada discreta del coseno para reducir el costo computacional y el coeficiente de correlación de Pearson para identificar tendencias de similitud.