Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requer...
- Autores:
-
Ariza Ladino, Carlos Fernando
- Tipo de recurso:
- Fecha de publicación:
- 2012
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/9961
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
Índice de Frases
Recuperación de Información
Extracción de Información
Reconocimiento de Entidades Nominales
Resolución de Correferencias
Clasificación Jerárquica / Phrase index
Information Retrieval
Information Extraction
Named entity recognition
Coreference resolution
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_91615a351e0adfe159b915c023950625 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/9961 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2León Guzmán, ElizabethAriza Ladino, Carlos Fernandod4132a97-0524-4e28-97bf-623e4f3664d73002019-06-24T23:26:47Z2019-06-24T23:26:47Z2012https://repositorio.unal.edu.co/handle/unal/9961http://bdigital.unal.edu.co/7020/En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de IngenieríaFacultad de IngenieríaAriza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general worksÍndice de FrasesRecuperación de InformaciónExtracción de InformaciónReconocimiento de Entidades NominalesResolución de CorreferenciasClasificación Jerárquica / Phrase indexInformation RetrievalInformation ExtractionNamed entity recognitionCoreference resolutionSistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de InformaciónTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL299792.2012.pdfapplication/pdf1349249https://repositorio.unal.edu.co/bitstream/unal/9961/1/299792.2012.pdff3c855e8bbb8d58871abe41538e96eb4MD51THUMBNAIL299792.2012.pdf.jpg299792.2012.pdf.jpgGenerated Thumbnailimage/jpeg4781https://repositorio.unal.edu.co/bitstream/unal/9961/2/299792.2012.pdf.jpged8a83f1ae0f31d40031eb38e457dfadMD52unal/9961oai:repositorio.unal.edu.co:unal/99612023-09-09 23:05:01.87Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |
dc.title.spa.fl_str_mv |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
title |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
spellingShingle |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información 0 Generalidades / Computer science, information and general works Índice de Frases Recuperación de Información Extracción de Información Reconocimiento de Entidades Nominales Resolución de Correferencias Clasificación Jerárquica / Phrase index Information Retrieval Information Extraction Named entity recognition Coreference resolution |
title_short |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
title_full |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
title_fullStr |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
title_full_unstemmed |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
title_sort |
Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información |
dc.creator.fl_str_mv |
Ariza Ladino, Carlos Fernando |
dc.contributor.author.spa.fl_str_mv |
Ariza Ladino, Carlos Fernando |
dc.contributor.spa.fl_str_mv |
León Guzmán, Elizabeth |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works |
topic |
0 Generalidades / Computer science, information and general works Índice de Frases Recuperación de Información Extracción de Información Reconocimiento de Entidades Nominales Resolución de Correferencias Clasificación Jerárquica / Phrase index Information Retrieval Information Extraction Named entity recognition Coreference resolution |
dc.subject.proposal.spa.fl_str_mv |
Índice de Frases Recuperación de Información Extracción de Información Reconocimiento de Entidades Nominales Resolución de Correferencias Clasificación Jerárquica / Phrase index Information Retrieval Information Extraction Named entity recognition Coreference resolution |
description |
En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system. |
publishDate |
2012 |
dc.date.issued.spa.fl_str_mv |
2012 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T23:26:47Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T23:26:47Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/9961 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/7020/ |
url |
https://repositorio.unal.edu.co/handle/unal/9961 http://bdigital.unal.edu.co/7020/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Facultad de Ingeniería |
dc.relation.references.spa.fl_str_mv |
Ariza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/9961/1/299792.2012.pdf https://repositorio.unal.edu.co/bitstream/unal/9961/2/299792.2012.pdf.jpg |
bitstream.checksum.fl_str_mv |
f3c855e8bbb8d58871abe41538e96eb4 ed8a83f1ae0f31d40031eb38e457dfad |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089232484925440 |