Construcción de dos tesauros para el análisis de sentimientos en el idioma español

Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra i...

Full description

Autores:
Tipo de recurso:
masterThesis
Fecha de publicación:
2018
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/40755
Acceso en línea:
http://hdl.handle.net/10554/40755
https://doi.org/10.11144/Javeriana.10554.40755
Palabra clave:
Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
id JAVERIANA_1fdf135190e461f414a7142842679851
oai_identifier_str oai:repository.javeriana.edu.co:10554/40755
network_acronym_str JAVERIANA
network_name_str Repositorio Universidad Javeriana
repository_id_str
dc.title.none.fl_str_mv Construcción de dos tesauros para el análisis de sentimientos en el idioma español
title Construcción de dos tesauros para el análisis de sentimientos en el idioma español
spellingShingle Construcción de dos tesauros para el análisis de sentimientos en el idioma español
Reyes Jalizev, Nikolay Lenin
Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
title_short Construcción de dos tesauros para el análisis de sentimientos en el idioma español
title_full Construcción de dos tesauros para el análisis de sentimientos en el idioma español
title_fullStr Construcción de dos tesauros para el análisis de sentimientos en el idioma español
title_full_unstemmed Construcción de dos tesauros para el análisis de sentimientos en el idioma español
title_sort Construcción de dos tesauros para el análisis de sentimientos en el idioma español
dc.creator.none.fl_str_mv Reyes Jalizev, Nikolay Lenin
author Reyes Jalizev, Nikolay Lenin
author_facet Reyes Jalizev, Nikolay Lenin
author_role author
dc.contributor.none.fl_str_mv Alvarado Valencia, Jorge Andrés
dc.subject.none.fl_str_mv Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
topic Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
description Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra institución Pontificia Universidad Javeriana ha hecho una alianza con grandes empresas nacionales para crear el Centro de Excelencia y Apropiación de Big Data y Analytics, conocido como Caoba, que busca la integración de la investigación académica con el mundo empresarial. Dentro de la minería de texto se destaca el análisis de sentimientos, que sirve para analizar la percepción que se expresa en un texto sobre algún tema determinado. Una herramienta importante para el análisis de sentimientos es un diccionario o tesauro que contenga las palabras con una etiquetación que referencie su orientación respecto a la percepción que se quiere evaluar. Para su construcción se utiliza una metodología que consiste en extraer las palabras más comunes de diferentes fuentes para después aplicarles un tratamiento de limpieza, traducción y asignación de valores representativos de los sentimientos que se quieren expresar, provenientes de bases de datos producidas en inglés. Los resultados son dos tesauros, uno de uso genérico para cualquier texto y otro enfocado en el tema de alimentos. En ambos casos las etiquetas en su gran mayoría sonde naturaleza neutral. Esto puede ser consecuencia de que la fuente utilizada para la extracción tenga un sesgo hacia el sentido neutral.
publishDate 2018
dc.date.none.fl_str_mv 2018-02-12
2019-02-11T14:34:43Z
2019-02-11T14:34:43Z
2020-04-16T17:57:32Z
2020-04-16T17:57:32Z
dc.type.none.fl_str_mv http://purl.org/coar/version/c_ab4af688f83e57aa
Tesis/Trabajo de grado - Monografía - Maestría
http://purl.org/coar/resource_type/c_bdcc
info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/10554/40755
https://doi.org/10.11144/Javeriana.10554.40755
instname:Pontificia Universidad Javeriana
reponame:Repositorio Institucional - Pontificia Universidad Javeriana
repourl:https://repository.javeriana.edu.co
url http://hdl.handle.net/10554/40755
https://doi.org/10.11144/Javeriana.10554.40755
identifier_str_mv instname:Pontificia Universidad Javeriana
reponame:Repositorio Institucional - Pontificia Universidad Javeriana
repourl:https://repository.javeriana.edu.co
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv PDF
application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Pontificia Universidad Javeriana
Maestría en Ingeniería Industrial
Facultad de Ingeniería
publisher.none.fl_str_mv Pontificia Universidad Javeriana
Maestría en Ingeniería Industrial
Facultad de Ingeniería
dc.source.none.fl_str_mv reponame:Repositorio Universidad Javeriana
instname:Pontificia Universidad Javeriana
instacron:Pontificia Universidad Javeriana
instname_str Pontificia Universidad Javeriana
instacron_str Pontificia Universidad Javeriana
institution Pontificia Universidad Javeriana
reponame_str Repositorio Universidad Javeriana
collection Repositorio Universidad Javeriana
_version_ 1803712881043177472
spelling Construcción de dos tesauros para el análisis de sentimientos en el idioma españolReyes Jalizev, Nikolay LeninLexicónAnálisis de sentimientosTesauro de sentimientosProcesamiento natural del lenguajeLexicón in spanishSentiment analysisThesaurus for sentiment analysisNatural language processingMaestría en ingeniería industrial - Tesis y disertaciones académicasMinería de datosCaobaTesauros - ConstrucciónLas empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra institución Pontificia Universidad Javeriana ha hecho una alianza con grandes empresas nacionales para crear el Centro de Excelencia y Apropiación de Big Data y Analytics, conocido como Caoba, que busca la integración de la investigación académica con el mundo empresarial. Dentro de la minería de texto se destaca el análisis de sentimientos, que sirve para analizar la percepción que se expresa en un texto sobre algún tema determinado. Una herramienta importante para el análisis de sentimientos es un diccionario o tesauro que contenga las palabras con una etiquetación que referencie su orientación respecto a la percepción que se quiere evaluar. Para su construcción se utiliza una metodología que consiste en extraer las palabras más comunes de diferentes fuentes para después aplicarles un tratamiento de limpieza, traducción y asignación de valores representativos de los sentimientos que se quieren expresar, provenientes de bases de datos producidas en inglés. Los resultados son dos tesauros, uno de uso genérico para cualquier texto y otro enfocado en el tema de alimentos. En ambos casos las etiquetas en su gran mayoría sonde naturaleza neutral. Esto puede ser consecuencia de que la fuente utilizada para la extracción tenga un sesgo hacia el sentido neutral.The companies with the pass of the time tend to base their decision on relevant information coming from their environment. Therefore, fields such as data mining have a high level of importance. This has led many people to devote their efforts to gain an improvement in this field. For this reason, our institution Pontificia Universidad Javeriana has made an alliance with big companies in order to create the Center of Excellence and Appropriation of Big Data and Analytics, also known as Caoba, which seeks the integration of academic research with the business world. Within text mining, the sentiment analysis serves to analyze the perception expressed in a specific text. An important tool tor the sentiment analysis is a dictionary or thesaurus that contains the words with a label that references its orientation referring to the perception that is wanted to express. The methodology used consists of extracting the most common words from different sources and then apply them a cleaning treatment, translation and assignment of values representative of the feelings that are expressed, from databases produced in English. The results are two thesauri, one of generic use for any text and another focused on the subject of food. In both cases the labels are mostly neutral in nature. This may be due to the fact that the source used for the extraction has a bias towai ds the neutral directionMagíster en Ingeniería IndustrialMaestríaPontificia Universidad JaverianaMaestría en Ingeniería IndustrialFacultad de IngenieríaAlvarado Valencia, Jorge Andrés2019-02-11T14:34:43Z2020-04-16T17:57:32Z2019-02-11T14:34:43Z2020-04-16T17:57:32Z2018-02-12http://purl.org/coar/version/c_ab4af688f83e57aaTesis/Trabajo de grado - Monografía - Maestríahttp://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionPDFapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10554/40755https://doi.org/10.11144/Javeriana.10554.40755instname:Pontificia Universidad Javerianareponame:Repositorio Institucional - Pontificia Universidad Javerianarepourl:https://repository.javeriana.edu.cospaAtribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, “Los derechos morales sobre el trabajo son propiedad de los autores”, los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.http://purl.org/coar/access_right/c_abf2reponame:Repositorio Universidad Javerianainstname:Pontificia Universidad Javerianainstacron:Pontificia Universidad Javeriana2022-04-29T18:16:16Z