Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática

En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos cientí�ficos, la forma en que este contenido se relaciona y la representación de esta información, con el �n de desarrollar un sistema de recuperación de informac...

Full description

Autores:
Moreno Franco, José Guillermo
Tipo de recurso:
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/11957
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/11957
http://bdigital.unal.edu.co/9549/
Palabra clave:
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Búsqueda de información por contenido
anotación autom ática de imágenes
búsqueda de información en artículos científicos.
Content-based information retrieval
automatic image annotation
document information retrieval
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_f13f2e2bd4638e52eeb8681bcd5597c4
oai_identifier_str oai:repositorio.unal.edu.co:unal/11957
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
title Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
spellingShingle Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Búsqueda de información por contenido
anotación autom ática de imágenes
búsqueda de información en artículos científicos.
Content-based information retrieval
automatic image annotation
document information retrieval
title_short Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
title_full Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
title_fullStr Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
title_full_unstemmed Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
title_sort Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática
dc.creator.fl_str_mv Moreno Franco, José Guillermo
dc.contributor.author.spa.fl_str_mv Moreno Franco, José Guillermo
dc.contributor.spa.fl_str_mv González Osorio, Fabio Augusto
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Búsqueda de información por contenido
anotación autom ática de imágenes
búsqueda de información en artículos científicos.
Content-based information retrieval
automatic image annotation
document information retrieval
dc.subject.proposal.spa.fl_str_mv Búsqueda de información por contenido
anotación autom ática de imágenes
búsqueda de información en artículos científicos.
Content-based information retrieval
automatic image annotation
document information retrieval
description En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos cientí�ficos, la forma en que este contenido se relaciona y la representación de esta información, con el �n de desarrollar un sistema de recuperación de información por contenido especí�co para este tipo de colecciones. Para esto, un nuevo modelo de representación, recuperación y anotación automática de imágenes es propuesto. Este modelo está basado en estrategias de semántica latente para representaciónes estructuradas. El sistema desarrollado durante este trabajo es llamado Litermed, el cual implementa el modelo propuesto y ofrece las funcionalidades de procesamiento necesarias para la transformación de archivos correspondientes a artículos cientí�cos en la representación propuesta. Para esto se desarrollaron fases como: extracción de imágenes de archivos PDF, extracción de características textuales y visuales, construcción de índices de características con sus respectivas anotaciones, clasi�cación de modalidad de imágenes, solución y evaluación de consultas visuales. Además, Litermed permite la realización de consultas por medio de su interfaz web utilizando como consulta imágenes de ejemplo. Para la realización de una evaluación cuantitativa del sistema, se propone el uso de un versión modi�cada de un conjunto de datos conocido. Los resultados indican que el modelo propuesto de anotación automática mejora el desempeño obtenido por estrategias de recuperación por contenido del estado del arte.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-25T00:34:09Z
dc.date.available.spa.fl_str_mv 2019-06-25T00:34:09Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/11957
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/9549/
url https://repositorio.unal.edu.co/handle/unal/11957
http://bdigital.unal.edu.co/9549/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería
Facultad de Ingeniería
dc.relation.references.spa.fl_str_mv Moreno Franco, José Guillermo (2012) Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/11957/1/299777.2012.pdf
https://repositorio.unal.edu.co/bitstream/unal/11957/2/299777.2012.pdf.jpg
bitstream.checksum.fl_str_mv 9b42a814b895efafbce8fa58bdf5424e
ae637a26c1542d570cb2aab45c612e5f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089467314569216
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoMoreno Franco, José Guillermo96edc294-66ab-4045-910e-dbfcd3d6baed3002019-06-25T00:34:09Z2019-06-25T00:34:09Z2012https://repositorio.unal.edu.co/handle/unal/11957http://bdigital.unal.edu.co/9549/En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos cientí�ficos, la forma en que este contenido se relaciona y la representación de esta información, con el �n de desarrollar un sistema de recuperación de información por contenido especí�co para este tipo de colecciones. Para esto, un nuevo modelo de representación, recuperación y anotación automática de imágenes es propuesto. Este modelo está basado en estrategias de semántica latente para representaciónes estructuradas. El sistema desarrollado durante este trabajo es llamado Litermed, el cual implementa el modelo propuesto y ofrece las funcionalidades de procesamiento necesarias para la transformación de archivos correspondientes a artículos cientí�cos en la representación propuesta. Para esto se desarrollaron fases como: extracción de imágenes de archivos PDF, extracción de características textuales y visuales, construcción de índices de características con sus respectivas anotaciones, clasi�cación de modalidad de imágenes, solución y evaluación de consultas visuales. Además, Litermed permite la realización de consultas por medio de su interfaz web utilizando como consulta imágenes de ejemplo. Para la realización de una evaluación cuantitativa del sistema, se propone el uso de un versión modi�cada de un conjunto de datos conocido. Los resultados indican que el modelo propuesto de anotación automática mejora el desempeño obtenido por estrategias de recuperación por contenido del estado del arte.Abstract. In this work, we explore the use of automatic annotation strategies for text-visual information from research papers, as well as the relationship between the content and the representation to build a retrieval system for this specific type of documents. To achieved that, we propose a novel strategy for the representation, search and automatic annotation of images. This model, is based on strategies of latent semantic analysis for structured representations. The system that implements the proposed model is called Litermed. This system is able to process the research papers �les to achieve the proposed representation. The processing phases are decomposed as follow: image extraction from research paper files (PDF), text-visual features extraction, index files construction with associated annotations, modality image classi fication, solution and evaluation of visual queries. Additionaly, Litermed allows run visual queries over a web based interface. Finally, an exhuastive automatic evaluation is performed over a modified version of a public well know dataset. The results show that the proposed model outperforms the state-of-the-art methods of query-by-example search.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de IngenieríaFacultad de IngenieríaMoreno Franco, José Guillermo (2012) Recuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación Automática. Maestría thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringBúsqueda de información por contenidoanotación autom ática de imágenesbúsqueda de información en artículos científicos.Content-based information retrievalautomatic image annotationdocument information retrievalRecuperación de Imágenes en Artículos Cientitíficos usando estrategias de Anotación AutomáticaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299777.2012.pdfapplication/pdf2246069https://repositorio.unal.edu.co/bitstream/unal/11957/1/299777.2012.pdf9b42a814b895efafbce8fa58bdf5424eMD51THUMBNAIL299777.2012.pdf.jpg299777.2012.pdf.jpgGenerated Thumbnailimage/jpeg4244https://repositorio.unal.edu.co/bitstream/unal/11957/2/299777.2012.pdf.jpgae637a26c1542d570cb2aab45c612e5fMD52unal/11957oai:repositorio.unal.edu.co:unal/119572023-09-21 23:05:17.076Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co