Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machi...
- Autores:
-
Pizarro Rivera, Francisco
- Tipo de recurso:
- Masters Thesis
- Fecha de publicación:
- 2024
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- spa
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2079
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2079
- Palabra clave:
- Tweets
No supervisado
NLP
Tf-idf
Orientación semántica
Machine learning
VADER
- Rights
- License
- https://creativecommons.org/licenses/by-nc-sa/4.0/
id |
Vitela2_e579b763f11873c3d2616fe0f786a832 |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/2079 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
title |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
spellingShingle |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado Tweets No supervisado NLP Tf-idf Orientación semántica Machine learning VADER |
title_short |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
title_full |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
title_fullStr |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
title_full_unstemmed |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
title_sort |
Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado |
dc.creator.fl_str_mv |
Pizarro Rivera, Francisco |
dc.contributor.advisor.none.fl_str_mv |
Pabón, María Constanza |
dc.contributor.author.none.fl_str_mv |
Pizarro Rivera, Francisco |
dc.subject.none.fl_str_mv |
Tweets No supervisado NLP Tf-idf Orientación semántica Machine learning VADER |
topic |
Tweets No supervisado NLP Tf-idf Orientación semántica Machine learning VADER |
description |
El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-06-08T21:01:44Z |
dc.date.available.none.fl_str_mv |
2024-06-08T21:01:44Z |
dc.date.issued.none.fl_str_mv |
2024 |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_bdcc |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Maestría |
dc.type.redcol.none.fl_str_mv |
https://purl.org/redcol/resource_type/TM |
format |
http://purl.org/coar/resource_type/c_bdcc |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/2079 |
url |
https://vitela.javerianacali.edu.co/handle/11522/2079 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.creativecommons.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.none.fl_str_mv |
120 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/ed6e6fb1-e308-4b8b-ad03-a32cea3350c6/download https://vitela.javerianacali.edu.co/bitstreams/1421b425-3f4b-4144-ba36-6ae4bd9f7c06/download https://vitela.javerianacali.edu.co/bitstreams/4511f465-b5bf-4b17-a513-4bb99e2ad618/download https://vitela.javerianacali.edu.co/bitstreams/3874d939-559a-47df-8d40-63f2c324b728/download https://vitela.javerianacali.edu.co/bitstreams/db0eed39-1f40-4597-97ce-c8a377d87541/download https://vitela.javerianacali.edu.co/bitstreams/b36f8c9b-e901-4b6f-833c-91168e8ced54/download https://vitela.javerianacali.edu.co/bitstreams/411aeba1-39ea-4f70-a835-845e5454a70a/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 bf2b289e2a751839b52b6ca660267dff f478bcea390a26e598eb499f7babe2c9 980ef9e7ae27dbab5347c807918c0cbd fbfb1a2a6394efd67e3527ad48846503 08e4dcef0b2fb1f23dc0f03b54800be2 8624e94bd0ab96cbccf34126fcfa792e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1812095044080893952 |
spelling |
Pabón, María ConstanzaPizarro Rivera, Francisco2024-06-08T21:01:44Z2024-06-08T21:01:44Z2024https://vitela.javerianacali.edu.co/handle/11522/2079El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.120 p.application/pdfspaPontificia Universidad Javeriana Calihttps://creativecommons.org/licenses/by-nc-sa/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2TweetsNo supervisadoNLPTf-idfOrientación semánticaMachine learningVADERAnálisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisadohttp://purl.org/coar/resource_type/c_bdccTesis/Trabajo de grado - Monografía - Maestríahttps://purl.org/redcol/resource_type/TMFacultad de Ingeniería y Ciencias. Maestría en Ciencia de DatosPontificia Universidad Javeriana CaliMaestríaLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/ed6e6fb1-e308-4b8b-ad03-a32cea3350c6/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINAL4.LICENCIA DE USO - TG.pdf4.LICENCIA DE USO - TG.pdfapplication/pdf210011https://vitela.javerianacali.edu.co/bitstreams/1421b425-3f4b-4144-ba36-6ae4bd9f7c06/downloadbf2b289e2a751839b52b6ca660267dffMD51240418_DocumentoGradoFranciscoPizarro.pdf240418_DocumentoGradoFranciscoPizarro.pdfapplication/pdf5024760https://vitela.javerianacali.edu.co/bitstreams/4511f465-b5bf-4b17-a513-4bb99e2ad618/downloadf478bcea390a26e598eb499f7babe2c9MD52TEXT4.LICENCIA DE USO - TG.pdf.txt4.LICENCIA DE USO - TG.pdf.txtExtracted texttext/plain4876https://vitela.javerianacali.edu.co/bitstreams/3874d939-559a-47df-8d40-63f2c324b728/download980ef9e7ae27dbab5347c807918c0cbdMD511240418_DocumentoGradoFranciscoPizarro.pdf.txt240418_DocumentoGradoFranciscoPizarro.pdf.txtExtracted texttext/plain102098https://vitela.javerianacali.edu.co/bitstreams/db0eed39-1f40-4597-97ce-c8a377d87541/downloadfbfb1a2a6394efd67e3527ad48846503MD513THUMBNAIL4.LICENCIA DE USO - TG.pdf.jpg4.LICENCIA DE USO - TG.pdf.jpgGenerated Thumbnailimage/jpeg5306https://vitela.javerianacali.edu.co/bitstreams/b36f8c9b-e901-4b6f-833c-91168e8ced54/download08e4dcef0b2fb1f23dc0f03b54800be2MD512240418_DocumentoGradoFranciscoPizarro.pdf.jpg240418_DocumentoGradoFranciscoPizarro.pdf.jpgGenerated Thumbnailimage/jpeg3468https://vitela.javerianacali.edu.co/bitstreams/411aeba1-39ea-4f70-a835-845e5454a70a/download8624e94bd0ab96cbccf34126fcfa792eMD51411522/2079oai:vitela.javerianacali.edu.co:11522/20792024-06-25 05:13:50.556https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |