Construcción de dos tesauros para el análisis de sentimientos en el idioma español
Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra i...
- Autores:
- Tipo de recurso:
- masterThesis
- Fecha de publicación:
- 2018
- Institución:
- Pontificia Universidad Javeriana
- Repositorio:
- Repositorio Universidad Javeriana
- Idioma:
- spa
- OAI Identifier:
- oai:repository.javeriana.edu.co:10554/40755
- Palabra clave:
- Lexicón
Análisis de sentimientos
Tesauro de sentimientos
Procesamiento natural del lenguaje
Lexicón in spanish
Sentiment analysis
Thesaurus for sentiment analysis
Natural language processing
Maestría en ingeniería industrial - Tesis y disertaciones académicas
Minería de datos
Caoba
Tesauros - Construcción
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
Summary: | Las empresas con el paso del tiempo suelen basar la toma de decisiones en información relevante de su entorno. Por eso, campos como la minería de datos han logrado un nivel elevado. Esto ha llevado a muchas personas a dedicar sus esfuerzos en obtener un mejoramiento de este campo. Por eso, nuestra institución Pontificia Universidad Javeriana ha hecho una alianza con grandes empresas nacionales para crear el Centro de Excelencia y Apropiación de Big Data y Analytics, conocido como Caoba, que busca la integración de la investigación académica con el mundo empresarial. Dentro de la minería de texto se destaca el análisis de sentimientos, que sirve para analizar la percepción que se expresa en un texto sobre algún tema determinado. Una herramienta importante para el análisis de sentimientos es un diccionario o tesauro que contenga las palabras con una etiquetación que referencie su orientación respecto a la percepción que se quiere evaluar. Para su construcción se utiliza una metodología que consiste en extraer las palabras más comunes de diferentes fuentes para después aplicarles un tratamiento de limpieza, traducción y asignación de valores representativos de los sentimientos que se quieren expresar, provenientes de bases de datos producidas en inglés. Los resultados son dos tesauros, uno de uso genérico para cualquier texto y otro enfocado en el tema de alimentos. En ambos casos las etiquetas en su gran mayoría sonde naturaleza neutral. Esto puede ser consecuencia de que la fuente utilizada para la extracción tenga un sesgo hacia el sentido neutral. |
---|