Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales

La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos so...

Full description

Autores:
Sarmiento González, Angie Caterine
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/9526
Acceso en línea:
http://hdl.handle.net/20.500.12495/9526
Palabra clave:
Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
519.5
Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
Rights
openAccess
License
Atribución-NoComercial-CompartirIgual 4.0 Internacional
Description
Summary:La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos sobre la deforestación en el Amazonas, utilizando como insumo las opiniones publicadas por los usuarios de Twitter hispanohablantes para un periodo de estudio de enero de 2010 a septiembre de 2022. Para la extracción de datos se conectó mediante un API Twitter con Python y se extrajeron 46.596 datos, los cuales pasaron por fase de minería de texto y etiquetados mediante librerías de Python en tres polaridades o sentimientos asociados negativo, neutro y positivo, esta etapa es de gran importancia debido a que al extraer los datos directamente de Twitter no se cuenta con una columna que indique la polaridad asociada a cada tweet. Así mismo se realiza un análisis exploratorio de los datos para detectar posibles patrones en los datos, revelando que es más frecuente encontrar opiniones textuales sobre la deforestación en el Amazonas en la segunda mitad de cada año y en especial en Agosto de 2019 fecha que coincide con los grandes incendios en el Amazonas. Posteriormente se procede a entrenar y validar un modelo de redes neuronales artificiales LSTM Bidireccional, que permita clasificar de la manera más precisa, a través de un enfoque de análisis de sentimientos los tweets extraídos en distintos grados de opinión. El modelo elegido consta de una arquitectura de 4 capas incluyendo una capa de word embedding, una capa LSTM Bidireccional, una capa estándar con función de activación Relu y una capa de salida con función de activación softmax con una neurona por cada polaridad o sentimiento asociado. Al evaluar el modelo con técnicas como la matriz de confusión, el accuracy, la presicion, la sensibilidad, la especificidad, el F1-score y el coeficiente Kappa de Cohen, dichas medidas arrojaron un ajuste superior a 0.8 lo cual indica un muy ajuste de los datos al modelo de redes neuronales LSTM bidirecional propuesto. Demostrando de esta manera que este tipo de redes neuronales al tener memoria a corto y largo plazo son la alternativa ideal para problemas de análisis de secuencialidad en especial textual.