Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español

El presente trabajo consiste en la implementación y validación de un conjunto de algoritmos para la extracción de Palabras Clave de textos cortos en español, particularmente de textos clínicos generados en las atenciones del programa Mentes Colectivas de la Pontificia Universidad Javeriana. Se tuvie...

Full description

Autores:
Tipo de recurso:
masterThesis
Fecha de publicación:
2021
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/54231
Acceso en línea:
http://hdl.handle.net/10554/54231
https://doi.org/10.11144/Javeriana.10554.54231
Palabra clave:
Mentes Colectivas
Extracción palabras clave
CRISP-DM
Textos cortos en español
Mentes Colectivas
Keyword extraction
CRISP-DM
Spanish short text
Maestría en ingeniería de sistemas - Tesis y disertaciones académicas
Palabras claves
Programación (Computadores electrónicos)
Análisis de datos
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
id JAVERIANA_c34dfc1f4774141d29c33402d4667f6b
oai_identifier_str oai:repository.javeriana.edu.co:10554/54231
network_acronym_str JAVERIANA
network_name_str Repositorio Universidad Javeriana
repository_id_str
dc.title.none.fl_str_mv Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
Evaluation and implementation of automatic keyword extraction methods applied to short texts in Spanish
title Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
spellingShingle Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
Candelo Moreno, Kelly Giselle
Mentes Colectivas
Extracción palabras clave
CRISP-DM
Textos cortos en español
Mentes Colectivas
Keyword extraction
CRISP-DM
Spanish short text
Maestría en ingeniería de sistemas - Tesis y disertaciones académicas
Palabras claves
Programación (Computadores electrónicos)
Análisis de datos
title_short Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
title_full Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
title_fullStr Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
title_full_unstemmed Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
title_sort Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en español
dc.creator.none.fl_str_mv Candelo Moreno, Kelly Giselle
Gutiérrez Ladino, Yeimy Andrea
Molano Ardila, Iván Felipe
author Candelo Moreno, Kelly Giselle
author_facet Candelo Moreno, Kelly Giselle
Gutiérrez Ladino, Yeimy Andrea
Molano Ardila, Iván Felipe
author_role author
author2 Gutiérrez Ladino, Yeimy Andrea
Molano Ardila, Iván Felipe
author2_role author
author
dc.contributor.none.fl_str_mv Pomares Quimbaya, Alexandra
Montero Posada, Anabel
García Diaz, Juan Carlos
dc.subject.none.fl_str_mv Mentes Colectivas
Extracción palabras clave
CRISP-DM
Textos cortos en español
Mentes Colectivas
Keyword extraction
CRISP-DM
Spanish short text
Maestría en ingeniería de sistemas - Tesis y disertaciones académicas
Palabras claves
Programación (Computadores electrónicos)
Análisis de datos
topic Mentes Colectivas
Extracción palabras clave
CRISP-DM
Textos cortos en español
Mentes Colectivas
Keyword extraction
CRISP-DM
Spanish short text
Maestría en ingeniería de sistemas - Tesis y disertaciones académicas
Palabras claves
Programación (Computadores electrónicos)
Análisis de datos
description El presente trabajo consiste en la implementación y validación de un conjunto de algoritmos para la extracción de Palabras Clave de textos cortos en español, particularmente de textos clínicos generados en las atenciones del programa Mentes Colectivas de la Pontificia Universidad Javeriana. Se tuvieron en cuenta diversos algoritmos, supervisados, y no supervisados, así como la aplicación de técnicas de Procesamiento de Lenguaje Natural y Aprendizaje de Máquina. Se utiliza la metodología CRISP-DM para el desarrollo del proyecto.
publishDate 2021
dc.date.none.fl_str_mv 2021-06-23T18:52:45Z
2021-06-23T18:52:45Z
dc.type.none.fl_str_mv http://purl.org/coar/version/c_ab4af688f83e57aa
Tesis/Trabajo de grado - Monografía - Maestría
http://purl.org/coar/resource_type/c_bdcc
info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/10554/54231
https://doi.org/10.11144/Javeriana.10554.54231
instname:Pontificia Universidad Javeriana
reponame:Repositorio Institucional - Pontificia Universidad Javeriana
repourl:https://repository.javeriana.edu.co
url http://hdl.handle.net/10554/54231
https://doi.org/10.11144/Javeriana.10554.54231
identifier_str_mv instname:Pontificia Universidad Javeriana
reponame:Repositorio Institucional - Pontificia Universidad Javeriana
repourl:https://repository.javeriana.edu.co
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv PDF
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Pontificia Universidad Javeriana
Maestría en Ingeniería de Sistemas y Computación
Facultad de Ingeniería
publisher.none.fl_str_mv Pontificia Universidad Javeriana
Maestría en Ingeniería de Sistemas y Computación
Facultad de Ingeniería
dc.source.none.fl_str_mv reponame:Repositorio Universidad Javeriana
instname:Pontificia Universidad Javeriana
instacron:Pontificia Universidad Javeriana
instname_str Pontificia Universidad Javeriana
instacron_str Pontificia Universidad Javeriana
institution Pontificia Universidad Javeriana
reponame_str Repositorio Universidad Javeriana
collection Repositorio Universidad Javeriana
_version_ 1803712834959310848
spelling Evaluación e implementación de métodos de extracción automática de palabras clave aplicados a textos cortos en españolEvaluation and implementation of automatic keyword extraction methods applied to short texts in SpanishCandelo Moreno, Kelly GiselleGutiérrez Ladino, Yeimy AndreaMolano Ardila, Iván FelipeMentes ColectivasExtracción palabras claveCRISP-DMTextos cortos en españolMentes ColectivasKeyword extractionCRISP-DMSpanish short textMaestría en ingeniería de sistemas - Tesis y disertaciones académicasPalabras clavesProgramación (Computadores electrónicos)Análisis de datosEl presente trabajo consiste en la implementación y validación de un conjunto de algoritmos para la extracción de Palabras Clave de textos cortos en español, particularmente de textos clínicos generados en las atenciones del programa Mentes Colectivas de la Pontificia Universidad Javeriana. Se tuvieron en cuenta diversos algoritmos, supervisados, y no supervisados, así como la aplicación de técnicas de Procesamiento de Lenguaje Natural y Aprendizaje de Máquina. Se utiliza la metodología CRISP-DM para el desarrollo del proyecto.This project is related to the implementation and validation of a set of algorithms for keyword extraction from short texts in Spanish, particularly from clinic texts generated as part of the interactions between users and consultants for the Mentes Colectivas service offered by the Pontificia Universidad Javeriana. Various algorithms where considered, supervised and not supervised, as well as Natural Language Processing and Machine Learning techniques. CRISP-DM methodology is used for the development of this Project.Magíster en Ingeniería de Sistemas y ComputaciónMaestríaPontificia Universidad JaverianaMaestría en Ingeniería de Sistemas y ComputaciónFacultad de IngenieríaPomares Quimbaya, AlexandraMontero Posada, AnabelGarcía Diaz, Juan Carlos2021-06-23T18:52:45Z2021-06-23T18:52:45Zhttp://purl.org/coar/version/c_ab4af688f83e57aaTesis/Trabajo de grado - Monografía - Maestríahttp://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionPDFapplication/pdfapplication/pdfhttp://hdl.handle.net/10554/54231https://doi.org/10.11144/Javeriana.10554.54231instname:Pontificia Universidad Javerianareponame:Repositorio Institucional - Pontificia Universidad Javerianarepourl:https://repository.javeriana.edu.cospaAtribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, "Los derechos morales sobre el trabajo son propiedad de los autores", los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.reponame:Repositorio Universidad Javerianainstname:Pontificia Universidad Javerianainstacron:Pontificia Universidad Javeriana2022-04-29T18:22:45Z