Prototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosql

En este trabajo se presenta el desarrollo de una herramienta de extracción de información para documentos PDF, cuyo funcionamiento se basa en la combinación de técnicas de rastreo de información, reconocimiento óptico de caracteres y patrones de extracción de información. El principal objetivo es pe...

Full description

Autores:: Parra Baquero, Andrea Nathaly
Robles Morales, Edison Armando

Tipo de recurso:: Trabajo de grado de pregrado

Fecha de publicación:: 2017

Institución:: Universidad Distrital Francisco José de Caldas

Repositorio:: RIUD: repositorio U. Distrital

Idioma:: spa

Description
Summary:	En este trabajo se presenta el desarrollo de una herramienta de extracción de información para documentos PDF, cuyo funcionamiento se basa en la combinación de técnicas de rastreo de información, reconocimiento óptico de caracteres y patrones de extracción de información. El principal objetivo es permitir la búsqueda de entidades nombradas en documentos PDF que se encuentran alojados en un dominio específico.

Prototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosql

Publicaciones similares