Recuperación de imágenes en artículos científicos usando estrategias de anotación automática

En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos científicos, la forma en que este contenido se relaciona y la representación de esta información, con el _n de desarrollar un sistema de recuperación de informaci...

Full description

Autores:
Moreno Franco, José Guillermo
Tipo de recurso:
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/12170
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/12170
http://bdigital.unal.edu.co/9818/
Palabra clave:
0 Generalidades / Computer science, information and general works
Búsqueda de información por contenido
de imágenes
Content-based information retrieval
Anotación automática
Búsqueda de información en artículos científicos
Automatic image
Annotation
Document information
Retrieval
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos científicos, la forma en que este contenido se relaciona y la representación de esta información, con el _n de desarrollar un sistema de recuperación de información por contenido específico para este tipo de colecciones. Para esto, un nuevo modelo de representación, recuperación y anotación automática de imágenes es propuesto. Este modelo está basado en estrategias de semántica latente para representaciones estructuradas. El sistema desarrollado durante este trabajo es llamado Litermed, el cual implementa el modelo propuesto y ofrece las funcionalidades de procesamiento necesarias para la transformación de archivos correspondientes a artículos científicos en la representación propuesta. Para esto se desarrollaron fases como: extracción de imágenes de archivos PDF, extracción de características textuales y visuales, construcción de índices de características con sus respectivas anotaciones, clasificación de modalidad de imágenes, solución y evaluación de consultas visuales. Además, Litermed permite la realización de consultas por medio de su interfaz web utilizando como consulta imágenes de ejemplo. Para la realización de una evaluación cuantitativa del sistema, se propone el uso de un versión modificada de un conjunto de datos conocido. Los resultados indican que el modelo propuesto de anotación automática mejora el desempeño obtenido por estrategias de recuperación por contenido del estado del arte.