Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.
Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un...
- Autores:
-
Fontalvo Pastorizo, John Edison
Rodríguez Donado, Juan Sebastián
- Tipo de recurso:
- Fecha de publicación:
- 2020
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/8860
- Acceso en línea:
- http://hdl.handle.net/10584/8860
- Palabra clave:
- Análisis de sentimientos
Twitter
NLP
Big Data
ML
Sentiment Analysis
Twitter
NLP
Big Data
ML
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_baf2a26bb16322b21fccb2bc1a008c20 |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/8860 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
dc.title.en_US.fl_str_mv |
Sentime: Analysis of Colombians' feelings about products, services or people through their tweets |
title |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
spellingShingle |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. Análisis de sentimientos NLP Big Data ML Sentiment Analysis NLP Big Data ML |
title_short |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
title_full |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
title_fullStr |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
title_full_unstemmed |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
title_sort |
Sentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets. |
dc.creator.fl_str_mv |
Fontalvo Pastorizo, John Edison Rodríguez Donado, Juan Sebastián |
dc.contributor.advisor.none.fl_str_mv |
Nieto Bernal, Wilson Zurek Varela, Eduardo Enrique |
dc.contributor.author.none.fl_str_mv |
Fontalvo Pastorizo, John Edison Rodríguez Donado, Juan Sebastián |
dc.subject.es_ES.fl_str_mv |
Análisis de sentimientos NLP Big Data ML |
topic |
Análisis de sentimientos NLP Big Data ML Sentiment Analysis NLP Big Data ML |
dc.subject.en_US.fl_str_mv |
Sentiment Analysis NLP Big Data ML |
description |
Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527 |
publishDate |
2020 |
dc.date.accessioned.none.fl_str_mv |
2020-06-01T20:10:35Z |
dc.date.available.none.fl_str_mv |
2020-06-01T20:10:35Z |
dc.date.issued.none.fl_str_mv |
2020-05-30 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/8860 |
url |
http://hdl.handle.net/10584/8860 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2020 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
http://manglar.uninorte.edu.co/bitstream/10584/8860/5/license.txt http://manglar.uninorte.edu.co/bitstream/10584/8860/1/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.png http://manglar.uninorte.edu.co/bitstream/10584/8860/2/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.pdf http://manglar.uninorte.edu.co/bitstream/10584/8860/3/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.png http://manglar.uninorte.edu.co/bitstream/10584/8860/4/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.pdf |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 3dd147a27574cc38599baed5e9bbf28b 4414dc2ce4cde234f205c97e8ab7eff1 9623a6077019a7938713677df5e3d9ee 48b4f8d9e95a3c606ef3bd81af57916c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1812183111754055680 |
spelling |
Nieto Bernal, WilsonZurek Varela, Eduardo EnriqueFontalvo Pastorizo, John EdisonRodríguez Donado, Juan Sebastián2020-06-01T20:10:35Z2020-06-01T20:10:35Z2020-05-30http://hdl.handle.net/10584/8860Esta propuesta surge de la necesidad de las PYMES de obtener información acerca de la opinión de las personas para tomar sus decisiones (Casero-Ripollés, 2020) en base a los sentimientos expresados por las personas hacia algún servicio, producto o persona. Con base a esto, se propone implementar un prototipo usando una red neuronal la cual clasificará los tweets por su sentimiento expresado. La red neuronal hace uso del embedding Word2Vec para obtener 1.4 billones de palabras en español de Wikipedia, el modelo es entrenado para ajustarse a los acentos locales junto con una capa LSTM bidireccional que se enfoca en entender el contexto de cada tweet. La obtención de los tweets es posible gracias a herramientas open source que nos permiten hacer web scraping, se obtienen únicamente tweets localizados dentro de los 32 departamentos de Colombia. Uno de los grandes retos en NLP es distinguir acentos locales y el contexto de las oraciones, por esta razón recolectamos tweets publicados en Colombia durante los últimos dos meses, los 80.000 tweets obtenidos fueron categorizados con AWS Comprehend, para después ser usados como el dataset de entrenamiento. El prototipo web llamado Sentime se encuentra alojado en AWS, permite realizar búsquedas y visualizar los resultados de la misma a través de un mapa de calor y gráficas por departamento en tiempo real, además los usuarios pueden acceder a su historial y también a todas las búsquedas realizadas en la plataforma. La red construida cuenta con un porcentaje de acierto del 78% para la clasificación de tweets en sentimientos positivos, negativos y neutrales. Casero-Ripollés, A. (2020). Influencia de los medios de comunicación en la conversación política en Twitter. Revista ICONO14 Revista Científica de Comunicación y Tecnologías Emergentes, 18(1), 33–57. https://doi.org/10.7195/ri14.v18i1.1527This proposal arises from the need of SMEs to obtain information about people's opinions in order to make their decisions (Casero-Ripollés, 2020) based on the feelings expressed by people towards a service, product or person. Based on this, it is proposed to implement a prototype using a neural network which will classify tweets by their expressed sentiment. The neural network makes use of Word2Vec embedding to get 1.4 billion Spanish words from Wikipedia, the model is trained to fit local accents along with a bi-directional LSTM layer that focuses on understanding the context of each tweet. The obtaining of the tweets is possible thanks to open source tools that allow us to do web scraping, only tweets located within the 32 departments of Colombia are obtained. One of the big challenges in NLP is to distinguish local accents and context from sentences, for this reason we collected tweets published in Colombia during the last two months, the 80,000 tweets obtained were categorized with AWS Comprehend, to be used later as the training dataset. The web prototype called Sentime is hosted by AWS, it allows users to perform searches and visualize the results through a heat map and graphics by department in real time. In addition, users can access their history and also all the searches performed on the platform. The built network has a 78% success rate for the classification of tweets into positive, negative and neutral feelings. Casero-Ripollés, A. (2020). Influence of the media on political conversation on Twitter. ICONO14 Scientific Journal of Communication and Emerging Technologies, 18(1), 33-57. https://doi.org/10.7195/ri14.v18i1.1527 Translated with www.DeepL.com/Translator (free version)spaBarranquilla, Universidad del Norte, 2020Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Análisis de sentimientosTwitterNLPBig DataMLSentiment AnalysisTwitterNLPBig DataMLSentime: Análisis de sentimientos de los Colombianos sobre productos, servicios o personas a través de sus tweets.Sentime: Analysis of Colombians' feelings about products, services or people through their tweetsarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://manglar.uninorte.edu.co/bitstream/10584/8860/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALDiagrama de flujo modelo solución english.pngDiagrama de flujo modelo solución english.pngImagen representativa png inglésimage/png55742http://manglar.uninorte.edu.co/bitstream/10584/8860/1/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.png3dd147a27574cc38599baed5e9bbf28bMD51Diagrama de flujo modelo solución english.pdfDiagrama de flujo modelo solución english.pdfImagen representativa pdf inglésapplication/pdf60009http://manglar.uninorte.edu.co/bitstream/10584/8860/2/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20english.pdf4414dc2ce4cde234f205c97e8ab7eff1MD52Diagrama de flujo modelo solución español.pngDiagrama de flujo modelo solución español.pngImagen representativa png españolimage/png60667http://manglar.uninorte.edu.co/bitstream/10584/8860/3/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.png9623a6077019a7938713677df5e3d9eeMD53Diagrama de flujo modelo solución español.pdfDiagrama de flujo modelo solución español.pdfImagen representativa pdf españolapplication/pdf65261http://manglar.uninorte.edu.co/bitstream/10584/8860/4/Diagrama%20de%20flujo%20modelo%20soluci%c3%b3n%20espa%c3%b1ol.pdf48b4f8d9e95a3c606ef3bd81af57916cMD5410584/8860oai:manglar.uninorte.edu.co:10584/88602020-06-01 15:10:35.904Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |