Detección de objetos en documentos digitales basado en algoritmos de Machine Learning

Este artículo propone un marco para crear modelos entrenados para la detección de objetos en documentos digitales utilizando redes neuronales convolucionales (CNN). Las CNN son redes artificiales capaces de aprender a distintos niveles de abstracción y están estructuradas de forma que se asemejan a...

Full description

Autores:
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/35562
Acceso en línea:
http://hdl.handle.net/11349/35562
Palabra clave:
Aprendizaje profundo
Detección de objetos
Aprendizaje automático
Detectron
Conjundo de datos
Redes neuronales convolucionales
Ingeniería Telemática -- Tesis y disertaciones académicas
Redes neuronales convolucionales (CNN)
Detección de objetos
Inteligencia artificial (IA)
Códigos QR
Deep learning
Object detection
Machine learning
Dataset
Convolutional neural networks
Detectron
Rights
License
Restringido (Solo Referencia)
Description
Summary:Este artículo propone un marco para crear modelos entrenados para la detección de objetos en documentos digitales utilizando redes neuronales convolucionales (CNN). Las CNN son redes artificiales capaces de aprender a distintos niveles de abstracción y están estructuradas de forma que se asemejan a las neuronas de la corteza visual primaria de un cerebro biológico. Para esta investigación se ha seleccionado el modelo X101-FPN, que se basa en redes neuronales preentrenadas expuestas dentro de las colecciones que ofrece la biblioteca Detectron 2. El modelo contiene una estructura jerárquica de 101 capas de CNN, una red neuronal residual y una red piramidal de funciones. Esta investigación presenta un caso de estudio para la detección de códigos QR utilizando técnicas de Inteligencia Artificial (IA) con redes neuronales convolucionales, basado en casos de estudio exitosos utilizando diferentes técnicas de Deep Learning. El modelo preentrenado se entrena en diferentes tipos de imágenes preprocesadas y con varios enfoques para medir la precisión correcta y el rendimiento frente a los escenarios propuestos. Finalmente, se realizan diversas pruebas para concluir las condiciones y mejores versiones de entrenamiento para la detección de códigos QR.