Reconocimiento de expresiones faciales usando un sistema embebido.
La detección facial a través de imágenes captadas por cámara es una necesidad tecnológica que al pasar del tiempo ha sido mejorada con la aplicación de algoritmos, el aumento de resolución en los dispositivos que capturan el rostro, la velocidad de procesamiento mejorada por los nuevos procesadores...
- Autores:
-
Zuluaga Calvache, Juan Pablo
Hernandez Reyes, Sergio Daniel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Pontificia Universidad Javeriana
- Repositorio:
- Repositorio Universidad Javeriana
- Idioma:
- spa
- OAI Identifier:
- oai:repository.javeriana.edu.co:10554/63654
- Acceso en línea:
- http://hdl.handle.net/10554/63654
- Palabra clave:
- Sistema embebido
Aprendizaje automático
Visión por computador
Procesamiento de imagenes
Detección facial
Embedded system
Machine Learning
Computer vision
Image processing
Face detection
Ingeniería electrónica - Tesis y disertaciones académicas
Aprendizaje de máquinas
Visión por computador
Procesamiento de imágenes
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
Summary: | La detección facial a través de imágenes captadas por cámara es una necesidad tecnológica que al pasar del tiempo ha sido mejorada con la aplicación de algoritmos, el aumento de resolución en los dispositivos que capturan el rostro, la velocidad de procesamiento mejorada por los nuevos procesadores y tarjetas gráficas que existen en el mercado. Este documento busca exponer al lector acerca de diferentes formas que existen actualmente para lograr identificar rostros en tiempo real y descifrar la expresión facial reconocida en dichos rostros en diferentes sistemas embebidos, por lo que demuestra que no es necesario poseer un equipo con hardware costoso o las mejores especificaciones para lograr dicho fin, se exponen los resultados del sistema funcional compilado en PC, Raspberry pi 4 y Jetson Nano. La identificación de rostros y sus diferentes emociones es un campo de investigación amplio, por esta razón se decidió acotar las variables que afectan la población, tamaño de muestra e instrumento de recolección de datos utilizado. La edad de las personas que se quiere identificar el rostro es de 16 a 45 años, mujeres y hombres incluidos en su funcionamiento (sin diferencia en su funcionalidad), detección de diferentes personas a la vez bajo diferentes escenarios como la variación de luz, enfoque y ángulo de inclinación en el rostro. Al implementar el código funcional en los tres sistemas embebidos nombrados anteriormente se identificó que el rendimiento depende de qué tan robusto sea el hardware sobre el que funciona el software, debido a que en un PC con un procesador de frecuencia base 3,9 GHz y tarjeta gráfica integrada de 1900 MHz el stream de la cámara e interfaz de usuario se nota fluido sin latencias ni caída de cuadros por segundo; mientras que, en los otros dos sistemas, aunque es funcional se notó un rendimiento desmejorado del sistema, bajaron los frames por segundo y se notaban latencias en el stream de la cámara de hasta cuatro segundos, esto sin hablar que al tratar de hacerlo funcionar hubo problemas con la instalación de librerías, funcionamiento del sistema operativo, reconocimiento de la cámara USB e incompatibilidad de versiones de Python. La solución a estos problemas está expuesta en el capítulo 4 nombrado “Migración de la solución a los sistemas embebidos”. La funcionalidad y rendimiento de la predicción de los algoritmos de inteligencia artificial puede variar por diferentes factores como el entrenamiento de la base de datos, el tipo de algoritmos utilizados, los parámetros del algoritmo y en el caso específico de este trabajo de grado puede variar por género, la cantidad de emociones que se puedan identificar y el sistema embebido en el que esté funcionando el programa, con el fin de exponer estas métricas consultar el capítulo 4 nombrado “Resultados” |
---|