Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información

En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requer...

Full description

Autores:
Ariza Ladino, Carlos Fernando
Tipo de recurso:
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/9961
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/9961
http://bdigital.unal.edu.co/7020/
Palabra clave:
0 Generalidades / Computer science, information and general works
Índice de Frases
Recuperación de Información
Extracción de Información
Reconocimiento de Entidades Nominales
Resolución de Correferencias
Clasificación Jerárquica / Phrase index
Information Retrieval
Information Extraction
Named entity recognition
Coreference resolution
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_91615a351e0adfe159b915c023950625
oai_identifier_str oai:repositorio.unal.edu.co:unal/9961
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2León Guzmán, ElizabethAriza Ladino, Carlos Fernandod4132a97-0524-4e28-97bf-623e4f3664d73002019-06-24T23:26:47Z2019-06-24T23:26:47Z2012https://repositorio.unal.edu.co/handle/unal/9961http://bdigital.unal.edu.co/7020/En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de IngenieríaFacultad de IngenieríaAriza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general worksÍndice de FrasesRecuperación de InformaciónExtracción de InformaciónReconocimiento de Entidades NominalesResolución de CorreferenciasClasificación Jerárquica / Phrase indexInformation RetrievalInformation ExtractionNamed entity recognitionCoreference resolutionSistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de InformaciónTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299792.2012.pdfapplication/pdf1349249https://repositorio.unal.edu.co/bitstream/unal/9961/1/299792.2012.pdff3c855e8bbb8d58871abe41538e96eb4MD51THUMBNAIL299792.2012.pdf.jpg299792.2012.pdf.jpgGenerated Thumbnailimage/jpeg4781https://repositorio.unal.edu.co/bitstream/unal/9961/2/299792.2012.pdf.jpged8a83f1ae0f31d40031eb38e457dfadMD52unal/9961oai:repositorio.unal.edu.co:unal/99612023-09-09 23:05:01.87Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
title Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
spellingShingle Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
0 Generalidades / Computer science, information and general works
Índice de Frases
Recuperación de Información
Extracción de Información
Reconocimiento de Entidades Nominales
Resolución de Correferencias
Clasificación Jerárquica / Phrase index
Information Retrieval
Information Extraction
Named entity recognition
Coreference resolution
title_short Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
title_full Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
title_fullStr Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
title_full_unstemmed Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
title_sort Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
dc.creator.fl_str_mv Ariza Ladino, Carlos Fernando
dc.contributor.author.spa.fl_str_mv Ariza Ladino, Carlos Fernando
dc.contributor.spa.fl_str_mv León Guzmán, Elizabeth
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
topic 0 Generalidades / Computer science, information and general works
Índice de Frases
Recuperación de Información
Extracción de Información
Reconocimiento de Entidades Nominales
Resolución de Correferencias
Clasificación Jerárquica / Phrase index
Information Retrieval
Information Extraction
Named entity recognition
Coreference resolution
dc.subject.proposal.spa.fl_str_mv Índice de Frases
Recuperación de Información
Extracción de Información
Reconocimiento de Entidades Nominales
Resolución de Correferencias
Clasificación Jerárquica / Phrase index
Information Retrieval
Information Extraction
Named entity recognition
Coreference resolution
description En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-24T23:26:47Z
dc.date.available.spa.fl_str_mv 2019-06-24T23:26:47Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/9961
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/7020/
url https://repositorio.unal.edu.co/handle/unal/9961
http://bdigital.unal.edu.co/7020/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería
Facultad de Ingeniería
dc.relation.references.spa.fl_str_mv Ariza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/9961/1/299792.2012.pdf
https://repositorio.unal.edu.co/bitstream/unal/9961/2/299792.2012.pdf.jpg
bitstream.checksum.fl_str_mv f3c855e8bbb8d58871abe41538e96eb4
ed8a83f1ae0f31d40031eb38e457dfad
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089232484925440