Construcción de dos tesauros para el análisis de sentimientos en el idioma español
Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra i...
- Autores:
- Tipo de recurso:
- masterThesis
- Fecha de publicación:
- 2018
- Institución:
- Pontificia Universidad Javeriana
- Repositorio:
- Repositorio Universidad Javeriana
- Idioma:
- spa
- OAI Identifier:
- oai:repository.javeriana.edu.co:10554/40755
- Palabra clave:
- Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
id |
JAVERIANA_1fdf135190e461f414a7142842679851 |
---|---|
oai_identifier_str |
oai:repository.javeriana.edu.co:10554/40755 |
network_acronym_str |
JAVERIANA |
network_name_str |
Repositorio Universidad Javeriana |
repository_id_str |
|
dc.title.none.fl_str_mv |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
title |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
spellingShingle |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español Reyes Jalizev, Nikolay Lenin Lexicón Análisis de sentimientos Tesauro de sentimientos Procesamiento natural del lenguaje Lexicón in spanish Sentiment analysis Thesaurus for sentiment analysis Natural language processing Maestría en ingeniería industrial - Tesis y disertaciones académicas Minería de datos Caoba Tesauros - Construcción |
title_short |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
title_full |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
title_fullStr |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
title_full_unstemmed |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
title_sort |
Construcción de dos tesauros para el análisis de sentimientos en el idioma español |
dc.creator.none.fl_str_mv |
Reyes Jalizev, Nikolay Lenin |
author |
Reyes Jalizev, Nikolay Lenin |
author_facet |
Reyes Jalizev, Nikolay Lenin |
author_role |
author |
dc.contributor.none.fl_str_mv |
Alvarado Valencia, Jorge Andrés |
dc.subject.none.fl_str_mv |
Lexicón Análisis de sentimientos Tesauro de sentimientos Procesamiento natural del lenguaje Lexicón in spanish Sentiment analysis Thesaurus for sentiment analysis Natural language processing Maestría en ingeniería industrial - Tesis y disertaciones académicas Minería de datos Caoba Tesauros - Construcción |
topic |
Lexicón Análisis de sentimientos Tesauro de sentimientos Procesamiento natural del lenguaje Lexicón in spanish Sentiment analysis Thesaurus for sentiment analysis Natural language processing Maestría en ingeniería industrial - Tesis y disertaciones académicas Minería de datos Caoba Tesauros - Construcción |
description |
Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra institución Pontificia Universidad Javeriana ha hecho una alianza con grandes empresas nacionales para crear el Centro de Excelencia y Apropiación de Big Data y Analytics, conocido como Caoba, que busca la integración de la investigación académica con el mundo empresarial. Dentro de la minería de texto se destaca el análisis de sentimientos, que sirve para analizar la percepción que se expresa en un texto sobre algún tema determinado. Una herramienta importante para el análisis de sentimientos es un diccionario o tesauro que contenga las palabras con una etiquetación que referencie su orientación respecto a la percepción que se quiere evaluar. Para su construcción se utiliza una metodología que consiste en extraer las palabras más comunes de diferentes fuentes para después aplicarles un tratamiento de limpieza, traducción y asignación de valores representativos de los sentimientos que se quieren expresar, provenientes de bases de datos producidas en inglés. Los resultados son dos tesauros, uno de uso genérico para cualquier texto y otro enfocado en el tema de alimentos. En ambos casos las etiquetas en su gran mayoría sonde naturaleza neutral. Esto puede ser consecuencia de que la fuente utilizada para la extracción tenga un sesgo hacia el sentido neutral. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-02-12 2019-02-11T14:34:43Z 2019-02-11T14:34:43Z 2020-04-16T17:57:32Z 2020-04-16T17:57:32Z |
dc.type.none.fl_str_mv |
http://purl.org/coar/version/c_ab4af688f83e57aa Tesis/Trabajo de grado - Monografía - Maestría http://purl.org/coar/resource_type/c_bdcc info:eu-repo/semantics/masterThesis info:eu-repo/semantics/publishedVersion |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/10554/40755 https://doi.org/10.11144/Javeriana.10554.40755 instname:Pontificia Universidad Javeriana reponame:Repositorio Institucional - Pontificia Universidad Javeriana repourl:https://repository.javeriana.edu.co |
url |
http://hdl.handle.net/10554/40755 https://doi.org/10.11144/Javeriana.10554.40755 |
identifier_str_mv |
instname:Pontificia Universidad Javeriana reponame:Repositorio Institucional - Pontificia Universidad Javeriana repourl:https://repository.javeriana.edu.co |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
PDF application/pdf application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Maestría en Ingeniería Industrial Facultad de Ingeniería |
publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Maestría en Ingeniería Industrial Facultad de Ingeniería |
dc.source.none.fl_str_mv |
reponame:Repositorio Universidad Javeriana instname:Pontificia Universidad Javeriana instacron:Pontificia Universidad Javeriana |
instname_str |
Pontificia Universidad Javeriana |
instacron_str |
Pontificia Universidad Javeriana |
institution |
Pontificia Universidad Javeriana |
reponame_str |
Repositorio Universidad Javeriana |
collection |
Repositorio Universidad Javeriana |
_version_ |
1803712881043177472 |
spelling |
Construcción de dos tesauros para el análisis de sentimientos en el idioma españolReyes Jalizev, Nikolay LeninLexicónAnálisis de sentimientosTesauro de sentimientosProcesamiento natural del lenguajeLexicón in spanishSentiment analysisThesaurus for sentiment analysisNatural language processingMaestría en ingeniería industrial - Tesis y disertaciones académicasMinería de datosCaobaTesauros - ConstrucciónLas empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra institución Pontificia Universidad Javeriana ha hecho una alianza con grandes empresas nacionales para crear el Centro de Excelencia y Apropiación de Big Data y Analytics, conocido como Caoba, que busca la integración de la investigación académica con el mundo empresarial. Dentro de la minería de texto se destaca el análisis de sentimientos, que sirve para analizar la percepción que se expresa en un texto sobre algún tema determinado. Una herramienta importante para el análisis de sentimientos es un diccionario o tesauro que contenga las palabras con una etiquetación que referencie su orientación respecto a la percepción que se quiere evaluar. Para su construcción se utiliza una metodología que consiste en extraer las palabras más comunes de diferentes fuentes para después aplicarles un tratamiento de limpieza, traducción y asignación de valores representativos de los sentimientos que se quieren expresar, provenientes de bases de datos producidas en inglés. Los resultados son dos tesauros, uno de uso genérico para cualquier texto y otro enfocado en el tema de alimentos. En ambos casos las etiquetas en su gran mayoría sonde naturaleza neutral. Esto puede ser consecuencia de que la fuente utilizada para la extracción tenga un sesgo hacia el sentido neutral.The companies with the pass of the time tend to base their decision on relevant information coming from their environment. Therefore, fields such as data mining have a high level of importance. This has led many people to devote their efforts to gain an improvement in this field. For this reason, our institution Pontificia Universidad Javeriana has made an alliance with big companies in order to create the Center of Excellence and Appropriation of Big Data and Analytics, also known as Caoba, which seeks the integration of academic research with the business world. Within text mining, the sentiment analysis serves to analyze the perception expressed in a specific text. An important tool tor the sentiment analysis is a dictionary or thesaurus that contains the words with a label that references its orientation referring to the perception that is wanted to express. The methodology used consists of extracting the most common words from different sources and then apply them a cleaning treatment, translation and assignment of values representative of the feelings that are expressed, from databases produced in English. The results are two thesauri, one of generic use for any text and another focused on the subject of food. In both cases the labels are mostly neutral in nature. This may be due to the fact that the source used for the extraction has a bias towai ds the neutral directionMagíster en Ingeniería IndustrialMaestríaPontificia Universidad JaverianaMaestría en Ingeniería IndustrialFacultad de IngenieríaAlvarado Valencia, Jorge Andrés2019-02-11T14:34:43Z2020-04-16T17:57:32Z2019-02-11T14:34:43Z2020-04-16T17:57:32Z2018-02-12http://purl.org/coar/version/c_ab4af688f83e57aaTesis/Trabajo de grado - Monografía - Maestríahttp://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionPDFapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10554/40755https://doi.org/10.11144/Javeriana.10554.40755instname:Pontificia Universidad Javerianareponame:Repositorio Institucional - Pontificia Universidad Javerianarepourl:https://repository.javeriana.edu.cospaAtribución-NoComercial-SinDerivadas 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, “Los derechos morales sobre el trabajo son propiedad de los autores”, los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.http://purl.org/coar/access_right/c_abf2reponame:Repositorio Universidad Javerianainstname:Pontificia Universidad Javerianainstacron:Pontificia Universidad Javeriana2022-04-29T18:16:16Z |