Sistema de Identificación de Objetos en Espacios Cerrados Basado en Segmentación Semántica

Este proyecto propone realizar el reconocimiento de objetos en entornos cerrados basado en segmentación semántica utilizando redes neuronales profundas. Para lograr esto, se han selec- cionado dos arquitecturas de referencia ampliamente utilizadas en el campo de la visión: YOLO (You Only Look Once,...

Full description

Autores:
Sarria Arteaga, Angela Maria
Rojas Guayambuco, Angela Maria
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/53053
Acceso en línea:
http://hdl.handle.net/11634/53053
Palabra clave:
Visión Artificial
Inteligencia artificial
Ingeniería Electrónica
Redes neuronales profundas
Reconocimiento de objetos
Segmentación semántica
YOLO
Mask R-CNN
Detección de objetos
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:Este proyecto propone realizar el reconocimiento de objetos en entornos cerrados basado en segmentación semántica utilizando redes neuronales profundas. Para lograr esto, se han selec- cionado dos arquitecturas de referencia ampliamente utilizadas en el campo de la visión: YOLO (You Only Look Once, YOLOv7) y Mask R-CNN. La elección de la arquitectura YOLOv7 para la detección de objetos se debe a su capacidad para identificar objetos de manera eficiente en tiempo real. YOLO utiliza una única iteración para detectar objetos en una imagen, lo que la hace especialmente adecuada para aplicaciones donde la velocidad es un factor crítico. Por otro lado, la arquitectura Mask R-CNN se seleccionó para abordar la tarea de la segmen- tación semántica. Esta permite asignar una máscara a cada objeto detectado, lo que brinda información detallada de la forma precisa de cada objeto en la imagen. Ambas arquitecturas, YOLO y Mask R-CNN, se han entrenado y evaluado utilizando la reco- nocida base de datos COCO (Common Objects in Context). COCO ofrece una amplia variedad de imágenes etiquetadas y anotadas, lo que permite entrenar las redes neuronales en un conjunto diverso de categorías de objetos y contextos.