Recuperación de imágenes en artículos científicos usando estrategias de anotación automática
En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos científicos, la forma en que este contenido se relaciona y la representación de esta información, con el _n de desarrollar un sistema de recuperación de informaci...
- Autores:
-
Moreno Franco, José Guillermo
- Tipo de recurso:
- Fecha de publicación:
- 2012
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/12170
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/12170
http://bdigital.unal.edu.co/9818/
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
Búsqueda de información por contenido
de imágenes
Content-based information retrieval
Anotación automática
Búsqueda de información en artículos científicos
Automatic image
Annotation
Document information
Retrieval
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_db2f409431a68df9705d4f21aeffcc09 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/12170 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
title |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
spellingShingle |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática 0 Generalidades / Computer science, information and general works Búsqueda de información por contenido de imágenes Content-based information retrieval Anotación automática Búsqueda de información en artículos científicos Automatic image Annotation Document information Retrieval |
title_short |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
title_full |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
title_fullStr |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
title_full_unstemmed |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
title_sort |
Recuperación de imágenes en artículos científicos usando estrategias de anotación automática |
dc.creator.fl_str_mv |
Moreno Franco, José Guillermo |
dc.contributor.author.spa.fl_str_mv |
Moreno Franco, José Guillermo |
dc.contributor.spa.fl_str_mv |
González Osorio, Fabio Augusto |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works |
topic |
0 Generalidades / Computer science, information and general works Búsqueda de información por contenido de imágenes Content-based information retrieval Anotación automática Búsqueda de información en artículos científicos Automatic image Annotation Document information Retrieval |
dc.subject.proposal.spa.fl_str_mv |
Búsqueda de información por contenido de imágenes Content-based information retrieval Anotación automática Búsqueda de información en artículos científicos Automatic image Annotation Document information Retrieval |
description |
En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos científicos, la forma en que este contenido se relaciona y la representación de esta información, con el _n de desarrollar un sistema de recuperación de información por contenido específico para este tipo de colecciones. Para esto, un nuevo modelo de representación, recuperación y anotación automática de imágenes es propuesto. Este modelo está basado en estrategias de semántica latente para representaciones estructuradas. El sistema desarrollado durante este trabajo es llamado Litermed, el cual implementa el modelo propuesto y ofrece las funcionalidades de procesamiento necesarias para la transformación de archivos correspondientes a artículos científicos en la representación propuesta. Para esto se desarrollaron fases como: extracción de imágenes de archivos PDF, extracción de características textuales y visuales, construcción de índices de características con sus respectivas anotaciones, clasificación de modalidad de imágenes, solución y evaluación de consultas visuales. Además, Litermed permite la realización de consultas por medio de su interfaz web utilizando como consulta imágenes de ejemplo. Para la realización de una evaluación cuantitativa del sistema, se propone el uso de un versión modificada de un conjunto de datos conocido. Los resultados indican que el modelo propuesto de anotación automática mejora el desempeño obtenido por estrategias de recuperación por contenido del estado del arte. |
publishDate |
2012 |
dc.date.issued.spa.fl_str_mv |
2012 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-25T00:38:35Z |
dc.date.available.spa.fl_str_mv |
2019-06-25T00:38:35Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/12170 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/9818/ |
url |
https://repositorio.unal.edu.co/handle/unal/12170 http://bdigital.unal.edu.co/9818/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Facultad de Ingeniería |
dc.relation.references.spa.fl_str_mv |
Moreno Franco, José Guillermo (2012) Recuperación de imágenes en artículos científicos usando estrategias de anotación automática. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/12170/1/299777.2012.pdf https://repositorio.unal.edu.co/bitstream/unal/12170/2/299777.2012.pdf.jpg |
bitstream.checksum.fl_str_mv |
7e5e92d6faae5aef3d2029c9ff0939eb ae637a26c1542d570cb2aab45c612e5f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090190733443072 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoMoreno Franco, José Guillermo96edc294-66ab-4045-910e-dbfcd3d6baed3002019-06-25T00:38:35Z2019-06-25T00:38:35Z2012https://repositorio.unal.edu.co/handle/unal/12170http://bdigital.unal.edu.co/9818/En este trabajo se explora la utilización de estrategias de anotación automática sobre información textual y visual obtenida de artículos científicos, la forma en que este contenido se relaciona y la representación de esta información, con el _n de desarrollar un sistema de recuperación de información por contenido específico para este tipo de colecciones. Para esto, un nuevo modelo de representación, recuperación y anotación automática de imágenes es propuesto. Este modelo está basado en estrategias de semántica latente para representaciones estructuradas. El sistema desarrollado durante este trabajo es llamado Litermed, el cual implementa el modelo propuesto y ofrece las funcionalidades de procesamiento necesarias para la transformación de archivos correspondientes a artículos científicos en la representación propuesta. Para esto se desarrollaron fases como: extracción de imágenes de archivos PDF, extracción de características textuales y visuales, construcción de índices de características con sus respectivas anotaciones, clasificación de modalidad de imágenes, solución y evaluación de consultas visuales. Además, Litermed permite la realización de consultas por medio de su interfaz web utilizando como consulta imágenes de ejemplo. Para la realización de una evaluación cuantitativa del sistema, se propone el uso de un versión modificada de un conjunto de datos conocido. Los resultados indican que el modelo propuesto de anotación automática mejora el desempeño obtenido por estrategias de recuperación por contenido del estado del arte.Abstract. In this work, we explore the use of automatic annotation strategies for text-visual information from research papers, as well as the relationship between the content and the representation to build a retrieval system for this specific type of documents. To achieved that, we propose a novel strategy for the representation, search and automatic annotation of images. This model, is based on strategies of latent semantic analysis for structured representations. The system that implements the proposed model is called Litermed. This system is able to process the research papers _les to achieve the proposed representation. The processing phases are decomposed as follow: image extraction from research paper _les (PDF), text-visual features extraction, index _les construction with associated annotations, modality image classification, solution and evaluation of visual queries. Additionaly, Litermed allows run visual queries over a web based interface. Finally, an exhaustive automatic evaluation is performed over a modified version of a public well know dataset. The results show that the proposed model outperforms the state-of-the-art methods of query-by-example search.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de IngenieríaFacultad de IngenieríaMoreno Franco, José Guillermo (2012) Recuperación de imágenes en artículos científicos usando estrategias de anotación automática. Maestría thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general worksBúsqueda de información por contenidode imágenesContent-based information retrievalAnotación automáticaBúsqueda de información en artículos científicosAutomatic imageAnnotationDocument informationRetrievalRecuperación de imágenes en artículos científicos usando estrategias de anotación automáticaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299777.2012.pdfapplication/pdf2075533https://repositorio.unal.edu.co/bitstream/unal/12170/1/299777.2012.pdf7e5e92d6faae5aef3d2029c9ff0939ebMD51THUMBNAIL299777.2012.pdf.jpg299777.2012.pdf.jpgGenerated Thumbnailimage/jpeg4244https://repositorio.unal.edu.co/bitstream/unal/12170/2/299777.2012.pdf.jpgae637a26c1542d570cb2aab45c612e5fMD52unal/12170oai:repositorio.unal.edu.co:unal/121702023-09-22 23:05:27.264Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |