Descriptor de imágenes en español utilizando técnicas de Deep Learning

Este proyecto de grado se centra en el desarrollo de un modelo basado en técnicas de Deep Learning para generar automáticamente descripciones de imágenes en español. La arquitectura Encoder-Decoder se explora para capturar relaciones contextuales entre el texto y las características visuales de las...

Full description

Autores:
Sierra Vidal, Lina María
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/73424
Acceso en línea:
https://hdl.handle.net/1992/73424
Palabra clave:
Deep learning
Imágenes
Descripción de imágenes
Ingeniería
Rights
openAccess
License
Attribution 4.0 International
Description
Summary:Este proyecto de grado se centra en el desarrollo de un modelo basado en técnicas de Deep Learning para generar automáticamente descripciones de imágenes en español. La arquitectura Encoder-Decoder se explora para capturar relaciones contextuales entre el texto y las características visuales de las imágenes. El modelo se entrena utilizando un amplio conjunto de datos de imágenes con sus descripciones en español. Se realizaron diversas comparaciones entre arquitecturas, modelos e hiperparámetros para obtener resultados coherentes y precisos. La evaluación del modelo se enfocó en métricas cuantitativas como la exactitud y la pérdida, así como en métricas específicas para tareas de generación de lenguaje natural, como BLEU y METEOR. Estas métricas permitieron medir la calidad y similitud de las descripciones generadas con respecto a las descripciones de referencia en el dataset. Este trabajo representa una contribución en el campo de la generación automática de descripciones de imágenes en español, con potenciales aplicaciones en diversos ámbitos, incluyendo la accesibilidad tecnológica para personas con discapacidad visual o neurológica. Una vez ajustado y validado, el modelo se implementó en una aplicación accesible que permite a los usuarios cargar imágenes y recibir descripciones de manera rápida en español. El enfoque de accesibilidad fue esencial durante todo el proceso de desarrollo, con el objetivo de brindar una solución tecnológica inclusiva para personas con diferentes niveles de discapacidad visual o neurológica.