Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings
Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Bo...
- Autores:
-
Hernández Mera, Michael
De Valdenebro Herrera, Juan Sebastián
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- eng
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2778
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2778
- Palabra clave:
- Transfer learning
Multilabel
Machine learning
Spectrogram
Anuran
- Rights
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
id |
Vitela2_9e8de99d4366e1498df0ca9d97569552 |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/2778 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.eng.fl_str_mv |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
title |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
spellingShingle |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings Transfer learning Multilabel Machine learning Spectrogram Anuran |
title_short |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
title_full |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
title_fullStr |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
title_full_unstemmed |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
title_sort |
Performance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordings |
dc.creator.fl_str_mv |
Hernández Mera, Michael De Valdenebro Herrera, Juan Sebastián |
dc.contributor.advisor.none.fl_str_mv |
Benítez, Hernán Darío |
dc.contributor.author.none.fl_str_mv |
Hernández Mera, Michael De Valdenebro Herrera, Juan Sebastián |
dc.subject.none.fl_str_mv |
Transfer learning Multilabel Machine learning Spectrogram Anuran |
topic |
Transfer learning Multilabel Machine learning Spectrogram Anuran |
description |
Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente. |
publishDate |
2023 |
dc.date.issued.none.fl_str_mv |
2023 |
dc.date.accessioned.none.fl_str_mv |
2024-06-17T16:58:05Z |
dc.date.available.none.fl_str_mv |
2024-06-17T16:58:05Z |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.redcol.none.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/2778 |
url |
https://vitela.javerianacali.edu.co/handle/11522/2778 |
dc.language.iso.none.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.creativecommons.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.none.fl_str_mv |
76 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Univerisdad Javeriana Cali |
publisher.none.fl_str_mv |
Pontificia Univerisdad Javeriana Cali |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/download https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/download https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/download https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/download https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download |
bitstream.checksum.fl_str_mv |
b0cf5132c8990552c01d3a236409e252 c3735fe0b05e723515e5aab56c2a8a53 62ed5e86c0926512411c585283d746c1 d670b9989a974c69e1e5d6b54cbc6819 5d4ce81405cbf73739f7ebdcda147dfc 0a7241ac48ff7d1d7a101f773b97d3fc 90eb91901f55aaa5c0e350dd74c4b9df c4f610dcbcce698ea4dda085da4add11 25d2bb9bbc8efcda074e5848ba7269ef 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1812095045793218560 |
spelling |
Benítez, Hernán DaríoHernández Mera, MichaelDe Valdenebro Herrera, Juan Sebastián2024-06-17T16:58:05Z2024-06-17T16:58:05Z2023https://vitela.javerianacali.edu.co/handle/11522/2778Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.Este proyecto de grado tiene como objetivo utilizar modelos de redes neuronales convolucionales (CNN) preentrenados para identificar tres especies diferentes de Anuros por sonido en una representación de tiempo-frecuencia. Las especies seleccionadas son: Boana albopunctata, Physalaemus cuvieri, y Boana lundii. Además, se analizó el rendimiento de diversos modelos y técnicas de aumentación de datos, para lograr una correcta clasificación multi-etiqueta, y las mejores prácticas para el procesamiento de audio, clasificación y automatización para las señales de sonido de los anfibios y también se discuten algunas referencias a las limitaciones asociadas con el monitoreo acústico de los anfibios y otras especies. El diseño metodológico del proyecto se dividió en cuatro etapas: preprocesamiento, aumento de datos, entrenamiento del modelo y evaluación del rendimiento de los modelos entrenados. El núcleo del proyecto se desarrolló en Python, para la etapa de preprocesamiento de datos en este proyecto se diseñó un “pipeline” para procesar los datos crudos proporcionados por el Instituto Humboldt y consistió en recortar los archivos de audio, generar espectrogramas, y fusionarlos con las anotaciones para devolver un conjunto de datos bien estructurados para el entrenamiento, en la etapa de aumento de datos las técnicas utilizadas fueron técnicas de estiramiento de tiempo, enmascaramiento de tiempo y enmascaramiento de frecuencia, por último, la fase de evaluación del rendimiento se realizó extrayendo de los modelos entrenados ( MobileNet, DenseNet121, InceptionV3 y Resnet50) la métrica de desempeño F1 utilizando un 30% del conjunto de datos no aumentado aislado del proceso de entrenamiento y comparando el rendimiento de cada modelo. Se realizaron tres experimentos, variando los hiperparámetros y la arquitectura, y utilizando diferentes conjuntos de datos. Se seleccionaron los mejores modelos en función de su rendimiento. Los mejores modelos (MobileNet con 1 FC Layer, DenseNet con 1 FC Layer, InceptionV3 con 2 FC Layer) alcanzó un desempeño F1 medio del 81% para la clasificación multi-etiqueta de las tres diferentes especies mencionadas anteriormente.76 p.application/pdfengPontificia Univerisdad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Transfer learningMultilabelMachine learningSpectrogramAnuranPerformance evaluation of multi-label classification models for the automated classification of anuran calls in audio recordingshttp://purl.org/coar/resource_type/c_7a1fTesis/Trabajo de grado - Monografía - Pregradohttps://purl.org/redcol/resource_type/TPFacultad de Ingeniería y Ciencias. Ingeniería ElectrónicaPontificia Universidad Javeriana CaliPregradoIngeniero(a)Electrónico(a)ORIGINALPerformance_evaluation_of_multi_label_classification.pdf.pdfPerformance_evaluation_of_multi_label_classification.pdf.pdfapplication/pdf11056425https://vitela.javerianacali.edu.co/bitstreams/b5aa69f4-445a-4228-b30d-fc6f5d7a6de5/downloadb0cf5132c8990552c01d3a236409e252MD51Articulo_cientifico.pdfArticulo_cientifico.pdfapplication/pdf830990https://vitela.javerianacali.edu.co/bitstreams/4dbe31d7-bb42-4774-89c5-967dbcc0ee9d/downloadc3735fe0b05e723515e5aab56c2a8a53MD52Licencia_autorizacion.pdfLicencia_autorizacion.pdfapplication/pdf240716https://vitela.javerianacali.edu.co/bitstreams/a8d33a53-24d8-4398-bcba-2e50296ca52d/download62ed5e86c0926512411c585283d746c1MD53TEXTArticulo_cientifico.pdf.txtArticulo_cientifico.pdf.txtExtracted texttext/plain19533https://vitela.javerianacali.edu.co/bitstreams/f8571140-d169-47a3-aef7-8292804b67da/downloadd670b9989a974c69e1e5d6b54cbc6819MD55Performance_evaluation_of_multi_label_classification.pdf.pdf.txtPerformance_evaluation_of_multi_label_classification.pdf.pdf.txtExtracted texttext/plain100748https://vitela.javerianacali.edu.co/bitstreams/4bfba02a-343a-49a0-900b-0a96fa0a5967/download5d4ce81405cbf73739f7ebdcda147dfcMD58Licencia_autorizacion.pdf.txtLicencia_autorizacion.pdf.txtExtracted texttext/plain5007https://vitela.javerianacali.edu.co/bitstreams/f35ca7bb-fac7-4cb1-9a90-c57276169706/download0a7241ac48ff7d1d7a101f773b97d3fcMD59THUMBNAILPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgPerformance_evaluation_of_multi_label_classification.pdf.pdf.jpgGenerated Thumbnailimage/jpeg3843https://vitela.javerianacali.edu.co/bitstreams/4573de97-c624-4e01-a290-8e51c4aa031d/download90eb91901f55aaa5c0e350dd74c4b9dfMD54Articulo_cientifico.pdf.jpgArticulo_cientifico.pdf.jpgGenerated Thumbnailimage/jpeg7203https://vitela.javerianacali.edu.co/bitstreams/e83c8d5d-7445-499f-9ef9-cccbc001906d/downloadc4f610dcbcce698ea4dda085da4add11MD56Licencia_autorizacion.pdf.jpgLicencia_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg5335https://vitela.javerianacali.edu.co/bitstreams/6a55cacb-8f7e-4bba-a6d4-55077c14dcc9/download25d2bb9bbc8efcda074e5848ba7269efMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/002aeb8b-7666-4f43-927f-35f1f8082589/download8a4605be74aa9ea9d79846c1fba20a33MD5211522/2778oai:vitela.javerianacali.edu.co:11522/27782024-06-25 05:15:23.721https://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |