Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings

Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Bo...

Full description

Autores:: Hernández Mera, Michael
De Valdenebro Herrera, Juan Sebastián

Tipo de recurso:: Trabajo de grado de pregrado

Fecha de publicación:: 2023

Institución:: Pontificia Universidad Javeriana Cali

Repositorio:: Vitela

Idioma:: eng

id	Vitela2_9e8de99d4366e1498df0ca9d97569552
oai_identifier_str	oai:vitela.javerianacali.edu.co:11522/2778
network_acronym_str	Vitela2
network_name_str	Vitela
repository_id_str
dc.title.eng.fl_str_mv	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
spellingShingle	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings Transfer learning Multilabel Machine learning Spectrogram Anuran
title_short	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_full	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_fullStr	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_full_unstemmed	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_sort	Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
dc.creator.fl_str_mv	Hernández Mera, Michael De Valdenebro Herrera, Juan Sebastián
dc.contributor.advisor.none.fl_str_mv	Benítez, Hernán Darío
dc.contributor.author.none.fl_str_mv	Hernández Mera, Michael De Valdenebro Herrera, Juan Sebastián
dc.subject.none.fl_str_mv	Transfer learning Multilabel Machine learning Spectrogram Anuran
topic	Transfer learning Multilabel Machine learning Spectrogram Anuran
description	Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.
publishDate	2023
dc.date.issued.none.fl_str_mv	2023
dc.date.accessioned.none.fl_str_mv	2024-06-17T16:58:05Z
dc.date.available.none.fl_str_mv	2024-06-17T16:58:05Z
dc.type.coar.none.fl_str_mv	http://purl.org/coar/resource_type/c_7a1f
dc.type.local.none.fl_str_mv	Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcol.none.fl_str_mv	https://purl.org/redcol/resource_type/TP
format	http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv	https://vitela.javerianacali.edu.co/handle/11522/2778
url	https://vitela.javerianacali.edu.co/handle/11522/2778
dc.language.iso.none.fl_str_mv	eng
language	eng
dc.rights.uri.none.fl_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons.none.fl_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv	http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv	76 p.
dc.format.mimetype.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontificia Univerisdad Javeriana Cali
publisher.none.fl_str_mv	Pontificia Univerisdad Javeriana Cali
institution	Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv	https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/download https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/download https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/download https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/download https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download
bitstream.checksum.fl_str_mv	b0cf5132c8990552c01d3a236409e252 c3735fe0b05e723515e5aab56c2a8a53 62ed5e86c0926512411c585283d746c1 d670b9989a974c69e1e5d6b54cbc6819 5d4ce81405cbf73739f7ebdcda147dfc 0a7241ac48ff7d1d7a101f773b97d3fc 90eb91901f55aaa5c0e350dd74c4b9df c4f610dcbcce698ea4dda085da4add11 25d2bb9bbc8efcda074e5848ba7269ef 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio Vitela
repository.mail.fl_str_mv	vitela.mail@javerianacali.edu.co
_version_	1829956333679411200
spelling	Benítez, Hernán DaríoHernández Mera, MichaelDe Valdenebro Herrera, Juan Sebastián2024-06-17T16:58:05Z2024-06-17T16:58:05Z2023https://vitela.javerianacali.edu.co/handle/11522/2778Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.76 p.application/pdfengPontificia Univerisdad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Transfer learningMultilabelMachine learningSpectrogramAnuranPerformance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordingshttp://purl.org/coar/resource_type/c_7a1fTesis/Trabajo de grado - Monografía - Pregradohttps://purl.org/redcol/resource_type/TPFacultad de Ingeniería y Ciencias. Ingeniería ElectrónicaPontificia Universidad Javeriana CaliPregradoIngeniero(a)Electrónico(a)ORIGINALPerformance_evaluation_of_multi_label_classification.pdf.pdfPerformance_evaluation_of_multi_label_classification.pdf.pdfapplication/pdf11056425https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/downloadb0cf5132c8990552c01d3a236409e252MD51Articulo_cientifico.pdfArticulo_cientifico.pdfapplication/pdf830990https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/downloadc3735fe0b05e723515e5aab56c2a8a53MD52Licencia_autorizacion.pdfLicencia_autorizacion.pdfapplication/pdf240716https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download62ed5e86c0926512411c585283d746c1MD53TEXTArticulo_cientifico.pdf.txtArticulo_cientifico.pdf.txtExtracted texttext/plain19533https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/downloadd670b9989a974c69e1e5d6b54cbc6819MD55Performance_evaluation_of_multi_label_classification.pdf.pdf.txtPerformance_evaluation_of_multi_label_classification.pdf.pdf.txtExtracted texttext/plain100748https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download5d4ce81405cbf73739f7ebdcda147dfcMD58Licencia_autorizacion.pdf.txtLicencia_autorizacion.pdf.txtExtracted texttext/plain5007https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download0a7241ac48ff7d1d7a101f773b97d3fcMD59THUMBNAILPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgGenerated Thumbnailimage/jpeg3843https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download90eb91901f55aaa5c0e350dd74c4b9dfMD54Articulo_cientifico.pdf.jpgArticulo_cientifico.pdf.jpgGenerated Thumbnailimage/jpeg7203https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/downloadc4f610dcbcce698ea4dda085da4add11MD56Licencia_autorizacion.pdf.jpgLicencia_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg5335https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download25d2bb9bbc8efcda074e5848ba7269efMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download8a4605be74aa9ea9d79846c1fba20a33MD5211522/2778oai:vitela.javerianacali.edu.co:11522/27782024-06-25 05:15:23.721https://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=

Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings

Publicaciones similares