Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un...
- Autores:
-
Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
- Tipo de recurso:
- Fecha de publicación:
- 2020
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/8860
- Acceso en línea:
- http://hdl.handle.net/10584/8860
- Palabra clave:
- Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
- Rights
- License
- Universidad del Norte
Summary: | Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527 |
---|