Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales

La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos so...

Full description

Autores:
Sarmiento González, Angie Caterine
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/9526
Acceso en línea:
http://hdl.handle.net/20.500.12495/9526
Palabra clave:
Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
519.5
Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
Rights
openAccess
License
Atribución-NoComercial-CompartirIgual 4.0 Internacional
id UNBOSQUE2_53eeb9be83d72d3e805e782aa55472f2
oai_identifier_str oai:repositorio.unbosque.edu.co:20.500.12495/9526
network_acronym_str UNBOSQUE2
network_name_str Repositorio U. El Bosque
repository_id_str
dc.title.spa.fl_str_mv Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
dc.title.translated.spa.fl_str_mv Twitter opinions from 2010 to 2022 regarding deforestation in the Amazon: a sentiment analysis with neural networks
title Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
spellingShingle Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
519.5
Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
title_short Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
title_full Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
title_fullStr Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
title_full_unstemmed Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
title_sort Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
dc.creator.fl_str_mv Sarmiento González, Angie Caterine
dc.contributor.advisor.none.fl_str_mv Ramos Montaña, Jesús David
dc.contributor.author.none.fl_str_mv Sarmiento González, Angie Caterine
dc.subject.spa.fl_str_mv Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
topic Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
519.5
Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
dc.subject.ddc.none.fl_str_mv 519.5
dc.subject.keywords.spa.fl_str_mv Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
description La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos sobre la deforestación en el Amazonas, utilizando como insumo las opiniones publicadas por los usuarios de Twitter hispanohablantes para un periodo de estudio de enero de 2010 a septiembre de 2022. Para la extracción de datos se conectó mediante un API Twitter con Python y se extrajeron 46.596 datos, los cuales pasaron por fase de minería de texto y etiquetados mediante librerías de Python en tres polaridades o sentimientos asociados negativo, neutro y positivo, esta etapa es de gran importancia debido a que al extraer los datos directamente de Twitter no se cuenta con una columna que indique la polaridad asociada a cada tweet. Así mismo se realiza un análisis exploratorio de los datos para detectar posibles patrones en los datos, revelando que es más frecuente encontrar opiniones textuales sobre la deforestación en el Amazonas en la segunda mitad de cada año y en especial en Agosto de 2019 fecha que coincide con los grandes incendios en el Amazonas. Posteriormente se procede a entrenar y validar un modelo de redes neuronales artificiales LSTM Bidireccional, que permita clasificar de la manera más precisa, a través de un enfoque de análisis de sentimientos los tweets extraídos en distintos grados de opinión. El modelo elegido consta de una arquitectura de 4 capas incluyendo una capa de word embedding, una capa LSTM Bidireccional, una capa estándar con función de activación Relu y una capa de salida con función de activación softmax con una neurona por cada polaridad o sentimiento asociado. Al evaluar el modelo con técnicas como la matriz de confusión, el accuracy, la presicion, la sensibilidad, la especificidad, el F1-score y el coeficiente Kappa de Cohen, dichas medidas arrojaron un ajuste superior a 0.8 lo cual indica un muy ajuste de los datos al modelo de redes neuronales LSTM bidirecional propuesto. Demostrando de esta manera que este tipo de redes neuronales al tener memoria a corto y largo plazo son la alternativa ideal para problemas de análisis de secuencialidad en especial textual.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-12-16T13:52:51Z
dc.date.available.none.fl_str_mv 2022-12-16T13:52:51Z
dc.date.issued.none.fl_str_mv 2022
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12495/9526
dc.identifier.instname.spa.fl_str_mv instname:Universidad El Bosque
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad El Bosque
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.unbosque.edu.co
url http://hdl.handle.net/20.500.12495/9526
identifier_str_mv instname:Universidad El Bosque
reponame:Repositorio Institucional Universidad El Bosque
repourl:https://repositorio.unbosque.edu.co
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.local.spa.fl_str_mv Acceso abierto
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-CompartirIgual 4.0 Internacional
http://creativecommons.org/licenses/by-nc-sa/4.0/
Acceso abierto
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Estadística
dc.publisher.grantor.spa.fl_str_mv Universidad El Bosque
dc.publisher.faculty.spa.fl_str_mv Facultad de Ciencias
institution Universidad El Bosque
bitstream.url.fl_str_mv https://repositorio.unbosque.edu.co/bitstreams/4746c0ba-0012-4d2e-8ad7-b4cae566edbb/download
https://repositorio.unbosque.edu.co/bitstreams/26ba349f-2590-4bfc-aa62-dc88f6b414f3/download
https://repositorio.unbosque.edu.co/bitstreams/a3a009d4-a97e-42c5-818f-3c3a3c9aecab/download
https://repositorio.unbosque.edu.co/bitstreams/f52992d9-00d3-47e1-a594-4ab0b072bc9b/download
https://repositorio.unbosque.edu.co/bitstreams/bb28559d-3f61-48ac-8fbe-d67f76e23c98/download
https://repositorio.unbosque.edu.co/bitstreams/0a6196c5-7648-4f16-8081-9728f7e0d8fa/download
bitstream.checksum.fl_str_mv 52b8b8dc81467980d5cba9a4ced42326
17cc15b951e7cc6b3728a574117320f9
b9f591e2d561c6bacf4afdd0fd6d767f
934f4ca17e109e0a05eaeaba504d7ce4
1e3a4ad1c760d783d0f48440a77c2e61
386db7d6376209749f1654a70de90ae4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad El Bosque
repository.mail.fl_str_mv bibliotecas@biteca.com
_version_ 1814100802097119232
spelling Ramos Montaña, Jesús DavidSarmiento González, Angie Caterine2022-12-16T13:52:51Z2022-12-16T13:52:51Z2022http://hdl.handle.net/20.500.12495/9526instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coLa deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos sobre la deforestación en el Amazonas, utilizando como insumo las opiniones publicadas por los usuarios de Twitter hispanohablantes para un periodo de estudio de enero de 2010 a septiembre de 2022. Para la extracción de datos se conectó mediante un API Twitter con Python y se extrajeron 46.596 datos, los cuales pasaron por fase de minería de texto y etiquetados mediante librerías de Python en tres polaridades o sentimientos asociados negativo, neutro y positivo, esta etapa es de gran importancia debido a que al extraer los datos directamente de Twitter no se cuenta con una columna que indique la polaridad asociada a cada tweet. Así mismo se realiza un análisis exploratorio de los datos para detectar posibles patrones en los datos, revelando que es más frecuente encontrar opiniones textuales sobre la deforestación en el Amazonas en la segunda mitad de cada año y en especial en Agosto de 2019 fecha que coincide con los grandes incendios en el Amazonas. Posteriormente se procede a entrenar y validar un modelo de redes neuronales artificiales LSTM Bidireccional, que permita clasificar de la manera más precisa, a través de un enfoque de análisis de sentimientos los tweets extraídos en distintos grados de opinión. El modelo elegido consta de una arquitectura de 4 capas incluyendo una capa de word embedding, una capa LSTM Bidireccional, una capa estándar con función de activación Relu y una capa de salida con función de activación softmax con una neurona por cada polaridad o sentimiento asociado. Al evaluar el modelo con técnicas como la matriz de confusión, el accuracy, la presicion, la sensibilidad, la especificidad, el F1-score y el coeficiente Kappa de Cohen, dichas medidas arrojaron un ajuste superior a 0.8 lo cual indica un muy ajuste de los datos al modelo de redes neuronales LSTM bidirecional propuesto. Demostrando de esta manera que este tipo de redes neuronales al tener memoria a corto y largo plazo son la alternativa ideal para problemas de análisis de secuencialidad en especial textual.Twitter DeveloperEstadísticoPregradoDeforestation in the Amazon is one of the biggest environmental problems in latest times, Because of that, it’s really important to have an understanding of people’s opinions about it. For this reason, in this research work, a sentiment analysis was performed regarding deforestation in the Amazon by using Twitter’s opinions of Hispanic speakers as the source, during a period of study between January 2010 and September 2020. To acquire data, Python was used to connect through a Twitter API, and 46.596 posts were collected, the data went through a text mining phase and were labeled using python libraries on three different sentiment categories; negative, neutral, and positive. This phase is of great importance since downloading data directly from Twitter does not have a column showing a polarity for each tweet. Likewise, an exploratory analysis was made to find patterns within the data, showing that it is more likely to find textual opinions about Amazon’s deforestation during the second half of each year, especially on August 2019 which matches with big fires in the Amazon rainforest. Subsequently, an artificial bidirectional LSTM neural network model was trained and validated. Allowing a more precise way to classify the data obtained within a sentiment analysis approach. The chosen model is composed of 4 layers including a word embedding layer, a bidirectional LSTM layer, a standard layer with ReLu activation function, and a releasing layer with softmax activation that includes one neuron for each polarity or sentiment association. When evaluating the model with techniques such as confusion matrix, the accuracy, precision, sensitivity, F1- score, and Cohen’s kappa coefficient, the result shows an adjustment higher than 0.8, which indicates good assimilation of data with the Bidirectional LSTM neural network proposed. Demonstrating that this type of neural networks are an ideal alternative for sequential analysis problems, especially text-based ones due to having better short and long-term memories.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2TwitterRedes neuronales LSTMAnálisis de sentimientosProcesamiento del lenguaje natural519.5TwitterLSTM neural networksSentiment analysisNatural language processingOpiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronalesTwitter opinions from 2010 to 2022 regarding deforestation in the Amazon: a sentiment analysis with neural networksEstadísticaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdfOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdfOpiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronalesapplication/pdf1313219https://repositorio.unbosque.edu.co/bitstreams/4746c0ba-0012-4d2e-8ad7-b4cae566edbb/download52b8b8dc81467980d5cba9a4ced42326MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/26ba349f-2590-4bfc-aa62-dc88f6b414f3/download17cc15b951e7cc6b3728a574117320f9MD54Anexo No_3 - Carta de Autorizacion de uso de tesis y trabajos de grado a favor de la UEB_Angie_Sarmiento.pdfAnexo No_3 - Carta de Autorizacion de uso de tesis y trabajos de grado a favor de la UEB_Angie_Sarmiento.pdfCarta de autorizaciónapplication/pdf388397https://repositorio.unbosque.edu.co/bitstreams/a3a009d4-a97e-42c5-818f-3c3a3c9aecab/downloadb9f591e2d561c6bacf4afdd0fd6d767fMD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/f52992d9-00d3-47e1-a594-4ab0b072bc9b/download934f4ca17e109e0a05eaeaba504d7ce4MD53THUMBNAILOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.jpgOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.jpgIM Thumbnailimage/jpeg5061https://repositorio.unbosque.edu.co/bitstreams/bb28559d-3f61-48ac-8fbe-d67f76e23c98/download1e3a4ad1c760d783d0f48440a77c2e61MD56TEXTOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.txtOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.txtExtracted texttext/plain101777https://repositorio.unbosque.edu.co/bitstreams/0a6196c5-7648-4f16-8081-9728f7e0d8fa/download386db7d6376209749f1654a70de90ae4MD5720.500.12495/9526oai:repositorio.unbosque.edu.co:20.500.12495/95262024-02-07 07:37:45.044http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo=