Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.

Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un...

Full description

Autores:
Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
Tipo de recurso:
Fecha de publicación:
2020
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/8860
Acceso en línea:
http://hdl.handle.net/10584/8860
Palabra clave:
Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
Rights
License
Universidad del Norte
Description
Summary:Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527