Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado

El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machi...

Full description

Autores:
Pizarro Rivera, Francisco
Tipo de recurso:
Masters Thesis
Fecha de publicación:
2024
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2079
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2079
Palabra clave:
Tweets
No supervisado
NLP
Tf-idf
Orientación semántica
Machine learning
VADER
Rights
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
id Vitela2_e579b763f11873c3d2616fe0f786a832
oai_identifier_str oai:vitela.javerianacali.edu.co:11522/2079
network_acronym_str Vitela2
network_name_str Vitela
repository_id_str
dc.title.spa.fl_str_mv Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
title Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
spellingShingle Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
Tweets
No supervisado
NLP
Tf-idf
Orientación semántica
Machine learning
VADER
title_short Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
title_full Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
title_fullStr Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
title_full_unstemmed Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
title_sort Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
dc.creator.fl_str_mv Pizarro Rivera, Francisco
dc.contributor.advisor.none.fl_str_mv Pabón, María Constanza
dc.contributor.author.none.fl_str_mv Pizarro Rivera, Francisco
dc.subject.none.fl_str_mv Tweets
No supervisado
NLP
Tf-idf
Orientación semántica
Machine learning
VADER
topic Tweets
No supervisado
NLP
Tf-idf
Orientación semántica
Machine learning
VADER
description El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-06-08T21:01:44Z
dc.date.available.none.fl_str_mv 2024-06-08T21:01:44Z
dc.date.issued.none.fl_str_mv 2024
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Maestría
dc.type.redcol.none.fl_str_mv https://purl.org/redcol/resource_type/TM
format http://purl.org/coar/resource_type/c_bdcc
dc.identifier.uri.none.fl_str_mv https://vitela.javerianacali.edu.co/handle/11522/2079
url https://vitela.javerianacali.edu.co/handle/11522/2079
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.creativecommons.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
https://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 120 p.
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontificia Universidad Javeriana Cali
publisher.none.fl_str_mv Pontificia Universidad Javeriana Cali
institution Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv https://vitela.javerianacali.edu.co/bitstreams/ed6e6fb1-e308-4b8b-ad03-a32cea3350c6/download
https://vitela.javerianacali.edu.co/bitstreams/1421b425-3f4b-4144-ba36-6ae4bd9f7c06/download
https://vitela.javerianacali.edu.co/bitstreams/4511f465-b5bf-4b17-a513-4bb99e2ad618/download
https://vitela.javerianacali.edu.co/bitstreams/3874d939-559a-47df-8d40-63f2c324b728/download
https://vitela.javerianacali.edu.co/bitstreams/db0eed39-1f40-4597-97ce-c8a377d87541/download
https://vitela.javerianacali.edu.co/bitstreams/b36f8c9b-e901-4b6f-833c-91168e8ced54/download
https://vitela.javerianacali.edu.co/bitstreams/411aeba1-39ea-4f70-a835-845e5454a70a/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
bf2b289e2a751839b52b6ca660267dff
f478bcea390a26e598eb499f7babe2c9
980ef9e7ae27dbab5347c807918c0cbd
fbfb1a2a6394efd67e3527ad48846503
08e4dcef0b2fb1f23dc0f03b54800be2
8624e94bd0ab96cbccf34126fcfa792e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Vitela
repository.mail.fl_str_mv vitela.mail@javerianacali.edu.co
_version_ 1808493669049696256
spelling Pabón, María ConstanzaPizarro Rivera, Francisco2024-06-08T21:01:44Z2024-06-08T21:01:44Z2024https://vitela.javerianacali.edu.co/handle/11522/2079El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.120 p.application/pdfspaPontificia Universidad Javeriana Calihttps://creativecommons.org/licenses/by-nc-sa/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2TweetsNo supervisadoNLPTf-idfOrientación semánticaMachine learningVADERAnálisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisadohttp://purl.org/coar/resource_type/c_bdccTesis/Trabajo de grado - Monografía - Maestríahttps://purl.org/redcol/resource_type/TMFacultad de Ingeniería y Ciencias. Maestría en Ciencia de DatosPontificia Universidad Javeriana CaliMaestríaLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/ed6e6fb1-e308-4b8b-ad03-a32cea3350c6/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINAL4.LICENCIA DE USO - TG.pdf4.LICENCIA DE USO - TG.pdfapplication/pdf210011https://vitela.javerianacali.edu.co/bitstreams/1421b425-3f4b-4144-ba36-6ae4bd9f7c06/downloadbf2b289e2a751839b52b6ca660267dffMD51240418_DocumentoGradoFranciscoPizarro.pdf240418_DocumentoGradoFranciscoPizarro.pdfapplication/pdf5024760https://vitela.javerianacali.edu.co/bitstreams/4511f465-b5bf-4b17-a513-4bb99e2ad618/downloadf478bcea390a26e598eb499f7babe2c9MD52TEXT4.LICENCIA DE USO - TG.pdf.txt4.LICENCIA DE USO - TG.pdf.txtExtracted texttext/plain4876https://vitela.javerianacali.edu.co/bitstreams/3874d939-559a-47df-8d40-63f2c324b728/download980ef9e7ae27dbab5347c807918c0cbdMD511240418_DocumentoGradoFranciscoPizarro.pdf.txt240418_DocumentoGradoFranciscoPizarro.pdf.txtExtracted texttext/plain102098https://vitela.javerianacali.edu.co/bitstreams/db0eed39-1f40-4597-97ce-c8a377d87541/downloadfbfb1a2a6394efd67e3527ad48846503MD513THUMBNAIL4.LICENCIA DE USO - TG.pdf.jpg4.LICENCIA DE USO - TG.pdf.jpgGenerated Thumbnailimage/jpeg5306https://vitela.javerianacali.edu.co/bitstreams/b36f8c9b-e901-4b6f-833c-91168e8ced54/download08e4dcef0b2fb1f23dc0f03b54800be2MD512240418_DocumentoGradoFranciscoPizarro.pdf.jpg240418_DocumentoGradoFranciscoPizarro.pdf.jpgGenerated Thumbnailimage/jpeg3468https://vitela.javerianacali.edu.co/bitstreams/411aeba1-39ea-4f70-a835-845e5454a70a/download8624e94bd0ab96cbccf34126fcfa792eMD51411522/2079oai:vitela.javerianacali.edu.co:11522/20792024-06-25 05:13:50.556https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=