Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings

Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Bo...

Full description

Autores:
Hernández Mera, Michael
De Valdenebro Herrera, Juan Sebastián
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
eng
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2778
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2778
Palabra clave:
Transfer learning
Multilabel
Machine learning
Spectrogram
Anuran
Rights
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
id Vitela2_9e8de99d4366e1498df0ca9d97569552
oai_identifier_str oai:vitela.javerianacali.edu.co:11522/2778
network_acronym_str Vitela2
network_name_str Vitela
repository_id_str
dc.title.eng.fl_str_mv Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
spellingShingle Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
Transfer learning
Multilabel
Machine learning
Spectrogram
Anuran
title_short Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_full Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_fullStr Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_full_unstemmed Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
title_sort Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
dc.creator.fl_str_mv Hernández Mera, Michael
De Valdenebro Herrera, Juan Sebastián
dc.contributor.advisor.none.fl_str_mv Benítez, Hernán Darío
dc.contributor.author.none.fl_str_mv Hernández Mera, Michael
De Valdenebro Herrera, Juan Sebastián
dc.subject.none.fl_str_mv Transfer learning
Multilabel
Machine learning
Spectrogram
Anuran
topic Transfer learning
Multilabel
Machine learning
Spectrogram
Anuran
description Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.
publishDate 2023
dc.date.issued.none.fl_str_mv 2023
dc.date.accessioned.none.fl_str_mv 2024-06-17T16:58:05Z
dc.date.available.none.fl_str_mv 2024-06-17T16:58:05Z
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcol.none.fl_str_mv https://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv https://vitela.javerianacali.edu.co/handle/11522/2778
url https://vitela.javerianacali.edu.co/handle/11522/2778
dc.language.iso.none.fl_str_mv eng
language eng
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 76 p.
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontificia Univerisdad Javeriana Cali
publisher.none.fl_str_mv Pontificia Univerisdad Javeriana Cali
institution Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/download
https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/download
https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download
https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/download
https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download
https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download
https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download
https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/download
https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download
https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download
bitstream.checksum.fl_str_mv b0cf5132c8990552c01d3a236409e252
c3735fe0b05e723515e5aab56c2a8a53
62ed5e86c0926512411c585283d746c1
d670b9989a974c69e1e5d6b54cbc6819
5d4ce81405cbf73739f7ebdcda147dfc
0a7241ac48ff7d1d7a101f773b97d3fc
90eb91901f55aaa5c0e350dd74c4b9df
c4f610dcbcce698ea4dda085da4add11
25d2bb9bbc8efcda074e5848ba7269ef
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Vitela
repository.mail.fl_str_mv vitela.mail@javerianacali.edu.co
_version_ 1812095045793218560
spelling Benítez, Hernán DaríoHernández Mera, MichaelDe Valdenebro Herrera, Juan Sebastián2024-06-17T16:58:05Z2024-06-17T16:58:05Z2023https://vitela.javerianacali.edu.co/handle/11522/2778Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.76 p.application/pdfengPontificia Univerisdad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Transfer learningMultilabelMachine learningSpectrogramAnuranPerformance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordingshttp://purl.org/coar/resource_type/c_7a1fTesis/Trabajo de grado - Monografía - Pregradohttps://purl.org/redcol/resource_type/TPFacultad de Ingeniería y Ciencias. Ingeniería ElectrónicaPontificia Universidad Javeriana CaliPregradoIngeniero(a)Electrónico(a)ORIGINALPerformance_evaluation_of_multi_label_classification.pdf.pdfPerformance_evaluation_of_multi_label_classification.pdf.pdfapplication/pdf11056425https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/downloadb0cf5132c8990552c01d3a236409e252MD51Articulo_cientifico.pdfArticulo_cientifico.pdfapplication/pdf830990https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/downloadc3735fe0b05e723515e5aab56c2a8a53MD52Licencia_autorizacion.pdfLicencia_autorizacion.pdfapplication/pdf240716https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download62ed5e86c0926512411c585283d746c1MD53TEXTArticulo_cientifico.pdf.txtArticulo_cientifico.pdf.txtExtracted texttext/plain19533https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/downloadd670b9989a974c69e1e5d6b54cbc6819MD55Performance_evaluation_of_multi_label_classification.pdf.pdf.txtPerformance_evaluation_of_multi_label_classification.pdf.pdf.txtExtracted texttext/plain100748https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download5d4ce81405cbf73739f7ebdcda147dfcMD58Licencia_autorizacion.pdf.txtLicencia_autorizacion.pdf.txtExtracted texttext/plain5007https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download0a7241ac48ff7d1d7a101f773b97d3fcMD59THUMBNAILPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgGenerated Thumbnailimage/jpeg3843https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download90eb91901f55aaa5c0e350dd74c4b9dfMD54Articulo_cientifico.pdf.jpgArticulo_cientifico.pdf.jpgGenerated Thumbnailimage/jpeg7203https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/downloadc4f610dcbcce698ea4dda085da4add11MD56Licencia_autorizacion.pdf.jpgLicencia_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg5335https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download25d2bb9bbc8efcda074e5848ba7269efMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download8a4605be74aa9ea9d79846c1fba20a33MD5211522/2778oai:vitela.javerianacali.edu.co:11522/27782024-06-25 05:15:23.721https://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=