Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales
La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos so...
- Autores:
-
Sarmiento González, Angie Caterine
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad El Bosque
- Repositorio:
- Repositorio U. El Bosque
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unbosque.edu.co:20.500.12495/9526
- Acceso en línea:
- http://hdl.handle.net/20.500.12495/9526
- Palabra clave:
- Twitter
Redes neuronales LSTM
Análisis de sentimientos
Procesamiento del lenguaje natural
519.5
Twitter
LSTM neural networks
Sentiment analysis
Natural language processing
- Rights
- openAccess
- License
- Atribución-NoComercial-CompartirIgual 4.0 Internacional
id |
UNBOSQUE2_53eeb9be83d72d3e805e782aa55472f2 |
---|---|
oai_identifier_str |
oai:repositorio.unbosque.edu.co:20.500.12495/9526 |
network_acronym_str |
UNBOSQUE2 |
network_name_str |
Repositorio U. El Bosque |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
dc.title.translated.spa.fl_str_mv |
Twitter opinions from 2010 to 2022 regarding deforestation in the Amazon: a sentiment analysis with neural networks |
title |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
spellingShingle |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales Redes neuronales LSTM Análisis de sentimientos Procesamiento del lenguaje natural 519.5 LSTM neural networks Sentiment analysis Natural language processing |
title_short |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
title_full |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
title_fullStr |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
title_full_unstemmed |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
title_sort |
Opiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronales |
dc.creator.fl_str_mv |
Sarmiento González, Angie Caterine |
dc.contributor.advisor.none.fl_str_mv |
Ramos Montaña, Jesús David |
dc.contributor.author.none.fl_str_mv |
Sarmiento González, Angie Caterine |
dc.subject.spa.fl_str_mv |
Twitter Redes neuronales LSTM Análisis de sentimientos Procesamiento del lenguaje natural |
topic |
Twitter Redes neuronales LSTM Análisis de sentimientos Procesamiento del lenguaje natural 519.5 LSTM neural networks Sentiment analysis Natural language processing |
dc.subject.ddc.none.fl_str_mv |
519.5 |
dc.subject.keywords.spa.fl_str_mv |
Twitter LSTM neural networks Sentiment analysis Natural language processing |
description |
La deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos sobre la deforestación en el Amazonas, utilizando como insumo las opiniones publicadas por los usuarios de Twitter hispanohablantes para un periodo de estudio de enero de 2010 a septiembre de 2022. Para la extracción de datos se conectó mediante un API Twitter con Python y se extrajeron 46.596 datos, los cuales pasaron por fase de minería de texto y etiquetados mediante librerías de Python en tres polaridades o sentimientos asociados negativo, neutro y positivo, esta etapa es de gran importancia debido a que al extraer los datos directamente de Twitter no se cuenta con una columna que indique la polaridad asociada a cada tweet. Así mismo se realiza un análisis exploratorio de los datos para detectar posibles patrones en los datos, revelando que es más frecuente encontrar opiniones textuales sobre la deforestación en el Amazonas en la segunda mitad de cada año y en especial en Agosto de 2019 fecha que coincide con los grandes incendios en el Amazonas. Posteriormente se procede a entrenar y validar un modelo de redes neuronales artificiales LSTM Bidireccional, que permita clasificar de la manera más precisa, a través de un enfoque de análisis de sentimientos los tweets extraídos en distintos grados de opinión. El modelo elegido consta de una arquitectura de 4 capas incluyendo una capa de word embedding, una capa LSTM Bidireccional, una capa estándar con función de activación Relu y una capa de salida con función de activación softmax con una neurona por cada polaridad o sentimiento asociado. Al evaluar el modelo con técnicas como la matriz de confusión, el accuracy, la presicion, la sensibilidad, la especificidad, el F1-score y el coeficiente Kappa de Cohen, dichas medidas arrojaron un ajuste superior a 0.8 lo cual indica un muy ajuste de los datos al modelo de redes neuronales LSTM bidirecional propuesto. Demostrando de esta manera que este tipo de redes neuronales al tener memoria a corto y largo plazo son la alternativa ideal para problemas de análisis de secuencialidad en especial textual. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-12-16T13:52:51Z |
dc.date.available.none.fl_str_mv |
2022-12-16T13:52:51Z |
dc.date.issued.none.fl_str_mv |
2022 |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12495/9526 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad El Bosque |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad El Bosque |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repositorio.unbosque.edu.co |
url |
http://hdl.handle.net/20.500.12495/9526 |
identifier_str_mv |
instname:Universidad El Bosque reponame:Repositorio Institucional Universidad El Bosque repourl:https://repositorio.unbosque.edu.co |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.*.fl_str_mv |
Atribución-NoComercial-CompartirIgual 4.0 Internacional |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.local.spa.fl_str_mv |
Acceso abierto |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-CompartirIgual 4.0 Internacional http://creativecommons.org/licenses/by-nc-sa/4.0/ Acceso abierto http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.program.spa.fl_str_mv |
Estadística |
dc.publisher.grantor.spa.fl_str_mv |
Universidad El Bosque |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ciencias |
institution |
Universidad El Bosque |
bitstream.url.fl_str_mv |
https://repositorio.unbosque.edu.co/bitstreams/4746c0ba-0012-4d2e-8ad7-b4cae566edbb/download https://repositorio.unbosque.edu.co/bitstreams/26ba349f-2590-4bfc-aa62-dc88f6b414f3/download https://repositorio.unbosque.edu.co/bitstreams/a3a009d4-a97e-42c5-818f-3c3a3c9aecab/download https://repositorio.unbosque.edu.co/bitstreams/f52992d9-00d3-47e1-a594-4ab0b072bc9b/download https://repositorio.unbosque.edu.co/bitstreams/bb28559d-3f61-48ac-8fbe-d67f76e23c98/download https://repositorio.unbosque.edu.co/bitstreams/0a6196c5-7648-4f16-8081-9728f7e0d8fa/download |
bitstream.checksum.fl_str_mv |
52b8b8dc81467980d5cba9a4ced42326 17cc15b951e7cc6b3728a574117320f9 b9f591e2d561c6bacf4afdd0fd6d767f 934f4ca17e109e0a05eaeaba504d7ce4 1e3a4ad1c760d783d0f48440a77c2e61 386db7d6376209749f1654a70de90ae4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad El Bosque |
repository.mail.fl_str_mv |
bibliotecas@biteca.com |
_version_ |
1814100802097119232 |
spelling |
Ramos Montaña, Jesús DavidSarmiento González, Angie Caterine2022-12-16T13:52:51Z2022-12-16T13:52:51Z2022http://hdl.handle.net/20.500.12495/9526instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coLa deforestación en el Amazonas es una de las grandes problemáticas medioambientales de los últimos tiempos, por esta razón es de gran importancia conocer la opinión de las personas frente a este tema, por tal motivo en este trabajo de investigación se decidió realizar un análisis de sentimientos sobre la deforestación en el Amazonas, utilizando como insumo las opiniones publicadas por los usuarios de Twitter hispanohablantes para un periodo de estudio de enero de 2010 a septiembre de 2022. Para la extracción de datos se conectó mediante un API Twitter con Python y se extrajeron 46.596 datos, los cuales pasaron por fase de minería de texto y etiquetados mediante librerías de Python en tres polaridades o sentimientos asociados negativo, neutro y positivo, esta etapa es de gran importancia debido a que al extraer los datos directamente de Twitter no se cuenta con una columna que indique la polaridad asociada a cada tweet. Así mismo se realiza un análisis exploratorio de los datos para detectar posibles patrones en los datos, revelando que es más frecuente encontrar opiniones textuales sobre la deforestación en el Amazonas en la segunda mitad de cada año y en especial en Agosto de 2019 fecha que coincide con los grandes incendios en el Amazonas. Posteriormente se procede a entrenar y validar un modelo de redes neuronales artificiales LSTM Bidireccional, que permita clasificar de la manera más precisa, a través de un enfoque de análisis de sentimientos los tweets extraídos en distintos grados de opinión. El modelo elegido consta de una arquitectura de 4 capas incluyendo una capa de word embedding, una capa LSTM Bidireccional, una capa estándar con función de activación Relu y una capa de salida con función de activación softmax con una neurona por cada polaridad o sentimiento asociado. Al evaluar el modelo con técnicas como la matriz de confusión, el accuracy, la presicion, la sensibilidad, la especificidad, el F1-score y el coeficiente Kappa de Cohen, dichas medidas arrojaron un ajuste superior a 0.8 lo cual indica un muy ajuste de los datos al modelo de redes neuronales LSTM bidirecional propuesto. Demostrando de esta manera que este tipo de redes neuronales al tener memoria a corto y largo plazo son la alternativa ideal para problemas de análisis de secuencialidad en especial textual.Twitter DeveloperEstadísticoPregradoDeforestation in the Amazon is one of the biggest environmental problems in latest times, Because of that, it’s really important to have an understanding of people’s opinions about it. For this reason, in this research work, a sentiment analysis was performed regarding deforestation in the Amazon by using Twitter’s opinions of Hispanic speakers as the source, during a period of study between January 2010 and September 2020. To acquire data, Python was used to connect through a Twitter API, and 46.596 posts were collected, the data went through a text mining phase and were labeled using python libraries on three different sentiment categories; negative, neutral, and positive. This phase is of great importance since downloading data directly from Twitter does not have a column showing a polarity for each tweet. Likewise, an exploratory analysis was made to find patterns within the data, showing that it is more likely to find textual opinions about Amazon’s deforestation during the second half of each year, especially on August 2019 which matches with big fires in the Amazon rainforest. Subsequently, an artificial bidirectional LSTM neural network model was trained and validated. Allowing a more precise way to classify the data obtained within a sentiment analysis approach. The chosen model is composed of 4 layers including a word embedding layer, a bidirectional LSTM layer, a standard layer with ReLu activation function, and a releasing layer with softmax activation that includes one neuron for each polarity or sentiment association. When evaluating the model with techniques such as confusion matrix, the accuracy, precision, sensitivity, F1- score, and Cohen’s kappa coefficient, the result shows an adjustment higher than 0.8, which indicates good assimilation of data with the Bidirectional LSTM neural network proposed. Demonstrating that this type of neural networks are an ideal alternative for sequential analysis problems, especially text-based ones due to having better short and long-term memories.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-sa/4.0/Acceso abiertoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2TwitterRedes neuronales LSTMAnálisis de sentimientosProcesamiento del lenguaje natural519.5TwitterLSTM neural networksSentiment analysisNatural language processingOpiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronalesTwitter opinions from 2010 to 2022 regarding deforestation in the Amazon: a sentiment analysis with neural networksEstadísticaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdfOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdfOpiniones en Twitter sobre la deforestación en el Amazonas del 2010 al 2022: Un análisis de sentimientos con redes neuronalesapplication/pdf1313219https://repositorio.unbosque.edu.co/bitstreams/4746c0ba-0012-4d2e-8ad7-b4cae566edbb/download52b8b8dc81467980d5cba9a4ced42326MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/26ba349f-2590-4bfc-aa62-dc88f6b414f3/download17cc15b951e7cc6b3728a574117320f9MD54Anexo No_3 - Carta de Autorizacion de uso de tesis y trabajos de grado a favor de la UEB_Angie_Sarmiento.pdfAnexo No_3 - Carta de Autorizacion de uso de tesis y trabajos de grado a favor de la UEB_Angie_Sarmiento.pdfCarta de autorizaciónapplication/pdf388397https://repositorio.unbosque.edu.co/bitstreams/a3a009d4-a97e-42c5-818f-3c3a3c9aecab/downloadb9f591e2d561c6bacf4afdd0fd6d767fMD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.unbosque.edu.co/bitstreams/f52992d9-00d3-47e1-a594-4ab0b072bc9b/download934f4ca17e109e0a05eaeaba504d7ce4MD53THUMBNAILOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.jpgOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.jpgIM Thumbnailimage/jpeg5061https://repositorio.unbosque.edu.co/bitstreams/bb28559d-3f61-48ac-8fbe-d67f76e23c98/download1e3a4ad1c760d783d0f48440a77c2e61MD56TEXTOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.txtOpiniones_en_Twitter_sobre_la_Deforestaci_n_en_el_Amazonas__Un_An_lisis_de_Sentimientos_con_Redes_Neuronales_Corregido.pdf.txtExtracted texttext/plain101777https://repositorio.unbosque.edu.co/bitstreams/0a6196c5-7648-4f16-8081-9728f7e0d8fa/download386db7d6376209749f1654a70de90ae4MD5720.500.12495/9526oai:repositorio.unbosque.edu.co:20.500.12495/95262024-02-07 07:37:45.044http://creativecommons.org/licenses/by-nc-sa/4.0/Atribución-NoComercial-CompartirIgual 4.0 Internacionalopen.accesshttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo= |