Tendency tracker : análisis de tendencias en redes sociales

El análisis de tendencias y en análisis de sentimientos son temas que han cogido gran popularidad en los últimos años debido al gran recurso que representan las redes sociales como fuente de información. Por esta razón, en este documento se utilizan 3 técnicas del estado del arte para la tarea de id...

Full description

Autores:
Garcia Pachon, Johan Ferney
Vanegas Ramirez, David Felipe
Cruz Gutierrez, Camilo Eduardo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/58430
Acceso en línea:
http://hdl.handle.net/10554/58430
Palabra clave:
Análisis de sentimiento
Procesamiento de lenguaje natural
Incrustaciones de palabras
Modelamiento de tópicos
Sentiment analysis
Natural language processing
Word embeddings
Topic modelling
Ingeniería de sistemas - Tesis y disertaciones académicas
Procesamiento de textos (Computadores electrónicos)
Desarrollo de software
Análisis de datos
Rights
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
Description
Summary:El análisis de tendencias y en análisis de sentimientos son temas que han cogido gran popularidad en los últimos años debido al gran recurso que representan las redes sociales como fuente de información. Por esta razón, en este documento se utilizan 3 técnicas del estado del arte para la tarea de identificación de tendencias en donde se obtiene que la implementación de LDA del paquete Gensim aplicada a textos normalizados es la que obtiene mejores resultados. Además, se implementaron 3 enfoques distintos para el análisis de sentimiento, en donde se destaca el enfoque de deep learning con incrustaciones de palabras locales con una precisión de 66.64%, muy por encima de los enfoques basado en lexicones y machine learning. Adicionalmente, se compararon los resultados del modelo de deep learning con incrustación de palabras locales versus con uno que tuviera incrustaciones de palabras genéricas como lo sería el de Wikipedia, obteniendo unos mejores resultados respecto a este último.