Aprendizaje por transferencia usando redes neuronales convolucionales para la clasificación de emociones en rostros

RESUMEN : En este trabajo se propone un enfoque basado en el aprendizaje por transferencia (del inglés, Transfer Learning, TL), este método consiste en usar y/o ajustar modelos previamente entrenados para mejorar el rendimiento de una tarea objetivo. Su eficiencia radica en el ahorro de tiempo y rec...

Full description

Autores:
Flórez Flórez, Marco Tulio
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/31908
Acceso en línea:
https://hdl.handle.net/10495/31908
Palabra clave:
Inteligencia artificial
Artificial intelligence
Transferencia de información
Information transfer
Canales de comunicación
Communication channels
Personalidad y emociones
Personality and emotions
http://vocabularies.unesco.org/thesaurus/concept3052
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : En este trabajo se propone un enfoque basado en el aprendizaje por transferencia (del inglés, Transfer Learning, TL), este método consiste en usar y/o ajustar modelos previamente entrenados para mejorar el rendimiento de una tarea objetivo. Su eficiencia radica en el ahorro de tiempo y recursos al no tener que entrenar modelos desde cero. Esta técnica se implementó en la clasificación de cuatro emociones: neutro, enojado, feliz y triste, con el fin de comprender el comportamiento de una persona frente a los acontecimientos que se presentan en un entorno dado. Reconocer las emociones mencionadas anteriormente, resulta de gran utilidad a la hora de realizar aplicaciones dentro de este ámbito, por ejemplo, en el área de la educación, los profesores pueden identificar el nivel de atención de sus alumnos a través de sus expresiones faciales. Otra área de aplicación es la seguridad, donde a partir de cámaras de vigilancia se pueda obtener información útil del estado emocional de una persona, que refleje en sus expresiones posibles amenazas para la seguridad propia o de terceros. Motivados por esto, en este trabajo se propone abordar el problema de clasificación de emociones en rostros implementando tres arquitecturas de redes neuronales convolucionales usando la base de datos FER-2013 para obtener modelos base y emplearlos en el aprendizaje por transferencia hacia la base de datos Cohn-Kanade, esto con el fin de mejorar la eficiencia de los modelos implementados para la clasificación de cuatro emociones: neutro, feliz, triste y enojado. Particularmente, en este trabajo se realizarón 5 experimentos con el fin de comparar y comprobar si la técnica de aprendizaje por transferencia mejora diferentes métricas de desempeño: I Implementación y evaluación de diferentes redes neuronales convolucionales (VGG-16, AlexNet y LeNet) utilizando la base de datos FER-2013. II Implementación y evaluación de redes neuronales convolucionales (VGG-16, AlexNet y LeNet) utilizando la base de datos Cohn-Kanade. III Implementación y evaluación de aprendizaje por transferencia desde los modelos creados con la base de datos FER-2013 para la clasificación de Cohn-Kanade. IV Implementación y comparación de métodos clásicos de clasificación como: máquinas de soporte vectorial (del inglés, Support Vector Machines, SVM), bosques aleatorios (del inglés, Random Forest, RF) y el algoritmo de aumento de gradiente extremo (del inglés, Extreme Gradient Boosting, XGBoost) a partir de representaciones intermedias obtenidas de las CNNs usando la técnica de triple pérdida. V Clasificación biclase a partir del plano de Arousal y Valencia, utilizando métodos clásicos sobre la base de datos Cohn-Kanade. En general los resultados muestran para los distintos experimentos realizados que la técnica de aprendizaje por transferencia incrementa el desempeño de la clasificación de emociones en rostros de personas en comparación a modelos entrenados desde cero. Al igual, se puede observar que la técnica triple pérdida en conjunto con métodos de clasificación clásicos, logran resultados comparables a los obtenidos a partir de redes neuronales profundas.