Natural language processing techniques for document retrieval in the biomedical domain
Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application....
- Autores:
-
Zuluaga Cajiao, Adelaida
- Tipo de recurso:
- Fecha de publicación:
- 2021
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/53581
- Acceso en línea:
- http://hdl.handle.net/1992/53581
- Palabra clave:
- Recuperación de información
Procesamiento de lenguaje natural (Computación)
Motores de búsqueda
Literatura científica
Ordenación jerárquica y selección (Estadística)
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id |
UNIANDES2_a45f0033a0b1a0d5a8838aa1d0ac757a |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/53581 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.eng.fl_str_mv |
Natural language processing techniques for document retrieval in the biomedical domain |
title |
Natural language processing techniques for document retrieval in the biomedical domain |
spellingShingle |
Natural language processing techniques for document retrieval in the biomedical domain Recuperación de información Procesamiento de lenguaje natural (Computación) Motores de búsqueda Literatura científica Ordenación jerárquica y selección (Estadística) Ingeniería |
title_short |
Natural language processing techniques for document retrieval in the biomedical domain |
title_full |
Natural language processing techniques for document retrieval in the biomedical domain |
title_fullStr |
Natural language processing techniques for document retrieval in the biomedical domain |
title_full_unstemmed |
Natural language processing techniques for document retrieval in the biomedical domain |
title_sort |
Natural language processing techniques for document retrieval in the biomedical domain |
dc.creator.fl_str_mv |
Zuluaga Cajiao, Adelaida |
dc.contributor.advisor.none.fl_str_mv |
Rosso, Andrés Enrique Higuera Arias, Carolina Lozano Martínez, Fernando Enrique |
dc.contributor.author.none.fl_str_mv |
Zuluaga Cajiao, Adelaida |
dc.contributor.jury.none.fl_str_mv |
Osma Cruz, Johann Faccelo Arévalo Ovalle, John Edilson |
dc.subject.armarc.none.fl_str_mv |
Recuperación de información Procesamiento de lenguaje natural (Computación) Motores de búsqueda Literatura científica Ordenación jerárquica y selección (Estadística) |
topic |
Recuperación de información Procesamiento de lenguaje natural (Computación) Motores de búsqueda Literatura científica Ordenación jerárquica y selección (Estadística) Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application. Having such a big amount of data turns out to be beneficial for decision-making in this domain, but a sufficiently accurate document retrieval system is required. A large number of NLP techniques and models have been proposed for text matching, but few of them have been able to consider the variations of language and the relationship between distant words in texts. This work is focused on formulating a method based on graph structures for building up a Document Retrieval system for the biomedical domain, and comparing the obtained results with traditional Document Retrieval techniques. The graph-based methods were selected to prove the importance of analyzing the semantic, syntactic, and long-distant word relationships in texts. It will be demonstrated that through the graph's topology the system is capable of extracting the structural information of documents, which solves relevant issues that are faced in this research area. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-11-03T16:28:51Z |
dc.date.available.none.fl_str_mv |
2021-11-03T16:28:51Z |
dc.date.issued.none.fl_str_mv |
2021 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/53581 |
dc.identifier.pdf.none.fl_str_mv |
24566.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/53581 |
identifier_str_mv |
24566.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
52 páginas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Maestría en Ingeniería Electrónica y de Computadores |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería Eléctrica y Electrónica |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/c2047c27-dccd-4cab-b264-2bcfec604d8e/download https://repositorio.uniandes.edu.co/bitstreams/facf92ba-68f3-4948-9b80-04f6e44145b7/download https://repositorio.uniandes.edu.co/bitstreams/39120760-d584-49ad-8e44-b708c3536748/download |
bitstream.checksum.fl_str_mv |
5834232f023c0ffaec47ad68793a9cf1 b9b41784376f7ee74f219484c0c5aaa4 b685aa7c808aa322c14b12693b79b9ab |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133996852674560 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Rosso, Andrés Enriqueffc6a0b5-02d5-4eee-bff2-a7f7c80d63a0500Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::12460-1Zuluaga Cajiao, Adelaida01b908e8-fc2c-4968-a0c6-6a4d1be7dbca500Osma Cruz, Johann FacceloArévalo Ovalle, John Edilson2021-11-03T16:28:51Z2021-11-03T16:28:51Z2021http://hdl.handle.net/1992/5358124566.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application. Having such a big amount of data turns out to be beneficial for decision-making in this domain, but a sufficiently accurate document retrieval system is required. A large number of NLP techniques and models have been proposed for text matching, but few of them have been able to consider the variations of language and the relationship between distant words in texts. This work is focused on formulating a method based on graph structures for building up a Document Retrieval system for the biomedical domain, and comparing the obtained results with traditional Document Retrieval techniques. The graph-based methods were selected to prove the importance of analyzing the semantic, syntactic, and long-distant word relationships in texts. It will be demonstrated that through the graph's topology the system is capable of extracting the structural information of documents, which solves relevant issues that are faced in this research area.La recuperación de documentos en el ámbito biomédico se ha ido ampliando a lo largo del tiempo, como consecuencia del crecimiento de la literatura biomédica disponible. Por lo tanto, hay un número creciente de investigaciones realizadas en este campo del conocimiento especialmente enfocadas en esta aplicación de Procesamiento de Lenguaje Natural. Tener una cantidad tan grande de datos resulta beneficioso para la toma de decisiones en este dominio, pero se requiere un sistema de recuperación de documentos lo suficientemente preciso. Se han propuesto una gran cantidad de técnicas y modelos de PLN para la correspondencia de textos, pero pocas de ellas han podido considerar las variaciones del lenguaje y la relación entre palabras distantes en los textos. Este trabajo se centra en formular un método basado en estructuras gráficas para construir un sistema de Recuperación de Documentos para el dominio biomédico, y comparar los resultados obtenidos con las técnicas tradicionales de Recuperación de Documentos. Los métodos basados ??en grafos se seleccionaron para demostrar la importancia de analizar las relaciones de palabras semánticas, sintácticas y de larga distancia en los textos. Se demostrará que a través de la topología del grafo el sistema es capaz de extraer la información estructural de los documentos, lo que resuelve cuestiones relevantes que se enfrentan en esta área de investigación.Magíster en Ingeniería Electrónica y de ComputadoresMaestría52 páginasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería Electrónica y de ComputadoresFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaNatural language processing techniques for document retrieval in the biomedical domainTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMRecuperación de informaciónProcesamiento de lenguaje natural (Computación)Motores de búsquedaLiteratura científicaOrdenación jerárquica y selección (Estadística)Ingeniería201424638Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::12460-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::12460-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::12460-1TEXT24566.pdf.txt24566.pdf.txtExtracted texttext/plain87870https://repositorio.uniandes.edu.co/bitstreams/c2047c27-dccd-4cab-b264-2bcfec604d8e/download5834232f023c0ffaec47ad68793a9cf1MD54THUMBNAIL24566.pdf.jpg24566.pdf.jpgIM Thumbnailimage/jpeg6276https://repositorio.uniandes.edu.co/bitstreams/facf92ba-68f3-4948-9b80-04f6e44145b7/downloadb9b41784376f7ee74f219484c0c5aaa4MD55ORIGINAL24566.pdfapplication/pdf719514https://repositorio.uniandes.edu.co/bitstreams/39120760-d584-49ad-8e44-b708c3536748/downloadb685aa7c808aa322c14b12693b79b9abMD511992/53581oai:repositorio.uniandes.edu.co:1992/535812024-03-13 14:41:31.065https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |