Natural language processing techniques for document retrieval in the biomedical domain

Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application....

Full description

Autores:
Zuluaga Cajiao, Adelaida
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/53581
Acceso en línea:
http://hdl.handle.net/1992/53581
Palabra clave:
Recuperación de información
Procesamiento de lenguaje natural (Computación)
Motores de búsqueda
Literatura científica
Ordenación jerárquica y selección (Estadística)
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_a45f0033a0b1a0d5a8838aa1d0ac757a
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/53581
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.eng.fl_str_mv Natural language processing techniques for document retrieval in the biomedical domain
title Natural language processing techniques for document retrieval in the biomedical domain
spellingShingle Natural language processing techniques for document retrieval in the biomedical domain
Recuperación de información
Procesamiento de lenguaje natural (Computación)
Motores de búsqueda
Literatura científica
Ordenación jerárquica y selección (Estadística)
Ingeniería
title_short Natural language processing techniques for document retrieval in the biomedical domain
title_full Natural language processing techniques for document retrieval in the biomedical domain
title_fullStr Natural language processing techniques for document retrieval in the biomedical domain
title_full_unstemmed Natural language processing techniques for document retrieval in the biomedical domain
title_sort Natural language processing techniques for document retrieval in the biomedical domain
dc.creator.fl_str_mv Zuluaga Cajiao, Adelaida
dc.contributor.advisor.none.fl_str_mv Rosso, Andrés Enrique
Higuera Arias, Carolina
Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Zuluaga Cajiao, Adelaida
dc.contributor.jury.none.fl_str_mv Osma Cruz, Johann Faccelo
Arévalo Ovalle, John Edilson
dc.subject.armarc.none.fl_str_mv Recuperación de información
Procesamiento de lenguaje natural (Computación)
Motores de búsqueda
Literatura científica
Ordenación jerárquica y selección (Estadística)
topic Recuperación de información
Procesamiento de lenguaje natural (Computación)
Motores de búsqueda
Literatura científica
Ordenación jerárquica y selección (Estadística)
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application. Having such a big amount of data turns out to be beneficial for decision-making in this domain, but a sufficiently accurate document retrieval system is required. A large number of NLP techniques and models have been proposed for text matching, but few of them have been able to consider the variations of language and the relationship between distant words in texts. This work is focused on formulating a method based on graph structures for building up a Document Retrieval system for the biomedical domain, and comparing the obtained results with traditional Document Retrieval techniques. The graph-based methods were selected to prove the importance of analyzing the semantic, syntactic, and long-distant word relationships in texts. It will be demonstrated that through the graph's topology the system is capable of extracting the structural information of documents, which solves relevant issues that are faced in this research area.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-11-03T16:28:51Z
dc.date.available.none.fl_str_mv 2021-11-03T16:28:51Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/53581
dc.identifier.pdf.none.fl_str_mv 24566.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/53581
identifier_str_mv 24566.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 52 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Maestría en Ingeniería Electrónica y de Computadores
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/c2047c27-dccd-4cab-b264-2bcfec604d8e/download
https://repositorio.uniandes.edu.co/bitstreams/facf92ba-68f3-4948-9b80-04f6e44145b7/download
https://repositorio.uniandes.edu.co/bitstreams/39120760-d584-49ad-8e44-b708c3536748/download
bitstream.checksum.fl_str_mv 5834232f023c0ffaec47ad68793a9cf1
b9b41784376f7ee74f219484c0c5aaa4
b685aa7c808aa322c14b12693b79b9ab
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133996852674560
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Rosso, Andrés Enriqueffc6a0b5-02d5-4eee-bff2-a7f7c80d63a0500Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::12460-1Zuluaga Cajiao, Adelaida01b908e8-fc2c-4968-a0c6-6a4d1be7dbca500Osma Cruz, Johann FacceloArévalo Ovalle, John Edilson2021-11-03T16:28:51Z2021-11-03T16:28:51Z2021http://hdl.handle.net/1992/5358124566.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Document Retrieval in the biomedical domain has been broadening through time, as a consequence of the growth of the available biomedical literature. Therefore, there is an increasing number of researches made in this knowledge field especially focused on this Natural Language Processing application. Having such a big amount of data turns out to be beneficial for decision-making in this domain, but a sufficiently accurate document retrieval system is required. A large number of NLP techniques and models have been proposed for text matching, but few of them have been able to consider the variations of language and the relationship between distant words in texts. This work is focused on formulating a method based on graph structures for building up a Document Retrieval system for the biomedical domain, and comparing the obtained results with traditional Document Retrieval techniques. The graph-based methods were selected to prove the importance of analyzing the semantic, syntactic, and long-distant word relationships in texts. It will be demonstrated that through the graph's topology the system is capable of extracting the structural information of documents, which solves relevant issues that are faced in this research area.La recuperación de documentos en el ámbito biomédico se ha ido ampliando a lo largo del tiempo, como consecuencia del crecimiento de la literatura biomédica disponible. Por lo tanto, hay un número creciente de investigaciones realizadas en este campo del conocimiento especialmente enfocadas en esta aplicación de Procesamiento de Lenguaje Natural. Tener una cantidad tan grande de datos resulta beneficioso para la toma de decisiones en este dominio, pero se requiere un sistema de recuperación de documentos lo suficientemente preciso. Se han propuesto una gran cantidad de técnicas y modelos de PLN para la correspondencia de textos, pero pocas de ellas han podido considerar las variaciones del lenguaje y la relación entre palabras distantes en los textos. Este trabajo se centra en formular un método basado en estructuras gráficas para construir un sistema de Recuperación de Documentos para el dominio biomédico, y comparar los resultados obtenidos con las técnicas tradicionales de Recuperación de Documentos. Los métodos basados ??en grafos se seleccionaron para demostrar la importancia de analizar las relaciones de palabras semánticas, sintácticas y de larga distancia en los textos. Se demostrará que a través de la topología del grafo el sistema es capaz de extraer la información estructural de los documentos, lo que resuelve cuestiones relevantes que se enfrentan en esta área de investigación.Magíster en Ingeniería Electrónica y de ComputadoresMaestría52 páginasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería Electrónica y de ComputadoresFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaNatural language processing techniques for document retrieval in the biomedical domainTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMRecuperación de informaciónProcesamiento de lenguaje natural (Computación)Motores de búsquedaLiteratura científicaOrdenación jerárquica y selección (Estadística)Ingeniería201424638Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::12460-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::12460-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::12460-1TEXT24566.pdf.txt24566.pdf.txtExtracted texttext/plain87870https://repositorio.uniandes.edu.co/bitstreams/c2047c27-dccd-4cab-b264-2bcfec604d8e/download5834232f023c0ffaec47ad68793a9cf1MD54THUMBNAIL24566.pdf.jpg24566.pdf.jpgIM Thumbnailimage/jpeg6276https://repositorio.uniandes.edu.co/bitstreams/facf92ba-68f3-4948-9b80-04f6e44145b7/downloadb9b41784376f7ee74f219484c0c5aaa4MD55ORIGINAL24566.pdfapplication/pdf719514https://repositorio.uniandes.edu.co/bitstreams/39120760-d584-49ad-8e44-b708c3536748/downloadb685aa7c808aa322c14b12693b79b9abMD511992/53581oai:repositorio.uniandes.edu.co:1992/535812024-03-13 14:41:31.065https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co