Descriptor de imágenes en español utilizando técnicas de Deep Learning
Este proyecto de grado se centra en el desarrollo de un modelo basado en técnicas de Deep Learning para generar automáticamente descripciones de imágenes en español. La arquitectura Encoder-Decoder se explora para capturar relaciones contextuales entre el texto y las características visuales de las...
- Autores:
-
Sierra Vidal, Lina María
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/73424
- Acceso en línea:
- https://hdl.handle.net/1992/73424
- Palabra clave:
- Deep learning
Imágenes
Descripción de imágenes
Ingeniería
- Rights
- openAccess
- License
- Attribution 4.0 International
Summary: | Este proyecto de grado se centra en el desarrollo de un modelo basado en técnicas de Deep Learning para generar automáticamente descripciones de imágenes en español. La arquitectura Encoder-Decoder se explora para capturar relaciones contextuales entre el texto y las características visuales de las imágenes. El modelo se entrena utilizando un amplio conjunto de datos de imágenes con sus descripciones en español. Se realizaron diversas comparaciones entre arquitecturas, modelos e hiperparámetros para obtener resultados coherentes y precisos. La evaluación del modelo se enfocó en métricas cuantitativas como la exactitud y la pérdida, así como en métricas específicas para tareas de generación de lenguaje natural, como BLEU y METEOR. Estas métricas permitieron medir la calidad y similitud de las descripciones generadas con respecto a las descripciones de referencia en el dataset. Este trabajo representa una contribución en el campo de la generación automática de descripciones de imágenes en español, con potenciales aplicaciones en diversos ámbitos, incluyendo la accesibilidad tecnológica para personas con discapacidad visual o neurológica. Una vez ajustado y validado, el modelo se implementó en una aplicación accesible que permite a los usuarios cargar imágenes y recibir descripciones de manera rápida en español. El enfoque de accesibilidad fue esencial durante todo el proceso de desarrollo, con el objetivo de brindar una solución tecnológica inclusiva para personas con diferentes niveles de discapacidad visual o neurológica. |
---|