Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.

Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un...

Full description

Autores:
Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
Tipo de recurso:
Fecha de publicación:
2020
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/8860
Acceso en línea:
http://hdl.handle.net/10584/8860
Palabra clave:
Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
Rights
License
Universidad del Norte
id REPOUNORT2_baf2a26bb16322b21fccb2bc1a008c20
oai_identifier_str oai:manglar.uninorte.edu.co:10584/8860
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
dc.title.en_US.fl_str_mv Sentime: Analysis of Colombians' feelings about products, services or people through their tweets
title Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
spellingShingle Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
title_short Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
title_full Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
title_fullStr Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
title_full_unstemmed Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
title_sort Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
dc.creator.fl_str_mv Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
dc.contributor.advisor.none.fl_str_mv Nieto Bernal, Wilson
Zurek Varela, Eduardo Enrique
dc.contributor.author.none.fl_str_mv Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
dc.subject.es_ES.fl_str_mv Análisis de sentimientos
Twitter
NLP
Big Data
ML
topic Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
dc.subject.en_US.fl_str_mv Sentiment Analysis
Twitter
NLP
Big Data
ML
description Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-06-01T20:10:35Z
dc.date.available.none.fl_str_mv 2020-06-01T20:10:35Z
dc.date.issued.none.fl_str_mv 2020-05-30
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/8860
url http://hdl.handle.net/10584/8860
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2020
institution Universidad del Norte
bitstream.url.fl_str_mv http://manglar.uninorte.edu.co/bitstream/10584/8860/5/license.txt
http://manglar.uninorte.edu.co/bitstream/10584/8860/1/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.png
http://manglar.uninorte.edu.co/bitstream/10584/8860/2/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.pdf
http://manglar.uninorte.edu.co/bitstream/10584/8860/3/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.png
http://manglar.uninorte.edu.co/bitstream/10584/8860/4/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
3dd147a27574cc38599baed5e9bbf28b
4414dc2ce4cde234f205c97e8ab7eff1
9623a6077019a7938713677df5e3d9ee
48b4f8d9e95a3c606ef3bd81af57916c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1812183111754055680
spelling Nieto Bernal, WilsonZurek Varela, Eduardo EnriqueFontalvo Pastorizo, John EdisonRodríguez Donado, Juan Sebastián2020-06-01T20:10:35Z2020-06-01T20:10:35Z2020-05-30http://hdl.handle.net/10584/8860Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527This proposal arises from the need of SMEs to obtain information about people's opinions in order to make their decisions (Casero-Ripollés, 2020) based on the feelings expressed by people towards a service, product or person. Based on this, it is proposed to implement a prototype using a neural network which will classify tweets by their expressed sentiment. The neural network makes use of Word2Vec embedding to get 1.4 billion Spanish words from Wikipedia, the model is trained to fit local accents along with a bi-directional LSTM layer that focuses on understanding the context of each tweet. The obtaining of the tweets is possible thanks to open source tools that allow us to do web scraping, only tweets located within the 32 departments of Colombia are obtained. One of the big challenges in NLP is to distinguish local accents and context from sentences, for this reason we collected tweets published in Colombia during the last two months, the 80,000 tweets obtained were categorized with AWS Comprehend, to be used later as the training dataset. The web prototype called Sentime is hosted by AWS, it allows users to perform searches and visualize the results through a heat map and graphics by department in real time. In addition, users can access their history and also all the searches performed on the platform. The built network has a 78% success rate for the classification of tweets into positive, negative and neutral feelings. Casero-Ripollés, A. (2020). Influence of the media on political conversation on Twitter. ICONO14 Scientific Journal of Communication and Emerging Technologies, 18(1), 33-57. https://doi.org/10.7195/ri14.v18i1.1527 Translated with www.DeepL.com/Translator (free version)spaBarranquilla, Universidad del Norte, 2020Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Análisis de sentimientosTwitterNLPBig DataMLSentiment AnalysisTwitterNLPBig DataMLSentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.Sentime: Analysis of Colombians' feelings about products, services or people through their tweetsarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://manglar.uninorte.edu.co/bitstream/10584/8860/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALDiagrama de flujo modelo solución english.pngDiagrama de flujo modelo solución english.pngImagen representativa png inglésimage/png55742http://manglar.uninorte.edu.co/bitstream/10584/8860/1/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.png3dd147a27574cc38599baed5e9bbf28bMD51Diagrama de flujo modelo solución english.pdfDiagrama de flujo modelo solución english.pdfImagen representativa pdf inglésapplication/pdf60009http://manglar.uninorte.edu.co/bitstream/10584/8860/2/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.pdf4414dc2ce4cde234f205c97e8ab7eff1MD52Diagrama de flujo modelo solución español.pngDiagrama de flujo modelo solución español.pngImagen representativa png españolimage/png60667http://manglar.uninorte.edu.co/bitstream/10584/8860/3/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.png9623a6077019a7938713677df5e3d9eeMD53Diagrama de flujo modelo solución español.pdfDiagrama de flujo modelo solución español.pdfImagen representativa pdf españolapplication/pdf65261http://manglar.uninorte.edu.co/bitstream/10584/8860/4/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.pdf48b4f8d9e95a3c606ef3bd81af57916cMD5410584/8860oai:manglar.uninorte.edu.co:10584/88602020-06-01 15:10:35.904Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=