Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.

Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los mode...

Full description

Autores:
Castrellón Botero, Juan Daniel
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/74536
Acceso en línea:
https://hdl.handle.net/1992/74536
Palabra clave:
Modelo
Periodico
BERT
Sentimientos
Ingeniería
Rights
embargoedAccess
License
Attribution 4.0 International
id UNIANDES2_4403176eb8d75fabd1fd8e5328b7010a
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/74536
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
title Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
spellingShingle Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
Modelo
Periodico
BERT
Sentimientos
Ingeniería
title_short Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
title_full Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
title_fullStr Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
title_full_unstemmed Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
title_sort Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
dc.creator.fl_str_mv Castrellón Botero, Juan Daniel
dc.contributor.advisor.none.fl_str_mv Manrique Piramanrique, Rubén Francisco
dc.contributor.author.none.fl_str_mv Castrellón Botero, Juan Daniel
dc.subject.keyword.spa.fl_str_mv Modelo
Periodico
BERT
Sentimientos
topic Modelo
Periodico
BERT
Sentimientos
Ingeniería
dc.subject.themes.spa.fl_str_mv Ingeniería
description Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los modelos entrenados en textos antiguos superaron a los modernos, logrando el mejor modelo una precisión del 65% en la clasificación de sentimientos positivos, negativos y neutros, aunque la detección de ironía resultó desafiante. Con el modelo desarrollado, se construyeron herramientas de análisis como líneas de tiempo y grafos de sentimientos, permitiendo visualizar la evolución de percepciones sobre diversos temas y entidades históricas en la Colombia del siglo XIX. El proyecto demuestra la viabilidad de aplicar técnicas modernas de procesamiento de lenguaje natural al análisis de textos históricos, ofreciendo nuevas perspectivas para estudios en humanidades y ciencias sociales, aunque se recomienda ampliar el conjunto de datos etiquetados y explorar nuevas arquitecturas para mejorar la precisión, especialmente en la detección de ironía.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-15T18:16:03Z
dc.date.issued.none.fl_str_mv 2024-07-15
dc.date.accepted.none.fl_str_mv 2024-07-15
dc.date.available.none.fl_str_mv 2025-07-16
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Audiovisual
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/74536
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/74536
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv Aladağ, F. (2023). The Potential of GPT in Ottoman Studies: Computational Analysis of Evliya Çelebi’s Travelogue with NLP and Text Mining and Digital Edition with TEI. https://doi.org/10.13140/RG.2.2.10335.43683
Al-Laith, A., Degn, K. N., Conroy, A., Pedersen, B. S., Bjerring-Hansen, J., & Hershcovich, D. (2023). Sentiment Classification of Historical Danish and Norwegian Literary Texts.
Finiteautomata/beto-sentiment-analysis · Hugging Face. (n.d.). Retrieved February 12, 2024, from https://huggingface.co/finiteautomata/beto-sentiment-analysis
Koncar, P. (n.d.). “A Sentiment Analysis Tool Chain for 18th Century Periodicals” on Melusina Press. Melusina Press. Retrieved February 4, 2024, from https://www.melusinapress.lu/read/ezpg-wk34/section/01ef33d1-8d9d-4391-a488-7d090f719858
Koncar, P., Fuchs, A., Hobisch, E., Geiger, B. C., Scholger, M., & Helic, D. (2020). Text sentiment in the Age of Enlightenment: An analysis of spectator periodicals. Applied Network Science, 5(1), 33. https://doi.org/10.1007/s41109-020-00269-z
Pavlopoulos, J., Xenos, A., & Picca, D. (2022). Sentiment Analysis of Homeric Text: The 1st Book of Iliad.
Sprugnoli, R., Tonelli, S., Marchetti, A., & Moretti, G. (2016). Towards sentiment analysis for historical texts. Digital Scholarship in the Humanities, 31(4), 762–772. https://doi.org/10.1093/llc/fqv027
dc.rights.en.fl_str_mv Attribution 4.0 International
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/embargoedAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_f1cf
rights_invalid_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_f1cf
eu_rights_str_mv embargoedAccess
dc.format.extent.none.fl_str_mv 31 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/4b1aed9e-1805-455b-926b-cae59ad2fd05/download
https://repositorio.uniandes.edu.co/bitstreams/a43f5dfd-068e-46a9-b7a6-415cdfed2bb3/download
https://repositorio.uniandes.edu.co/bitstreams/b7b93d9d-7862-4176-8239-3091b413c9f1/download
https://repositorio.uniandes.edu.co/bitstreams/03204873-d34d-4769-b479-7508e1d59525/download
https://repositorio.uniandes.edu.co/bitstreams/f0755536-ba9b-4268-a974-237aee1fd9bb/download
https://repositorio.uniandes.edu.co/bitstreams/6f17490b-744c-4e36-be90-e21548ead01b/download
https://repositorio.uniandes.edu.co/bitstreams/ae8d2ae5-9b0c-4f0a-8cc4-a75ce152dd0f/download
https://repositorio.uniandes.edu.co/bitstreams/b808640a-7fd7-4e78-882d-88098c97f9ee/download
bitstream.checksum.fl_str_mv ae9e573a68e7f92501b6913cc846c39f
df8fd344cf52ea0a4664cd79f4d90ab3
f83b82763c99d28e489a06a89effc145
0175ea4a2d4caec4bbcc37e300941108
e1c06d85ae7b8b032bef47e42e4c08f9
b73ad86beb483d8557735c0719c3ea68
9cb00878962ae919e42e64d24178d7f0
0ac9a694283f02e30c0d87654f874d1a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133928791703552
spelling Manrique Piramanrique, Rubén Franciscovirtual::18829-1Castrellón Botero, Juan Daniel2024-07-15T18:16:03Z2025-07-162024-07-152024-07-15https://hdl.handle.net/1992/74536instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los modelos entrenados en textos antiguos superaron a los modernos, logrando el mejor modelo una precisión del 65% en la clasificación de sentimientos positivos, negativos y neutros, aunque la detección de ironía resultó desafiante. Con el modelo desarrollado, se construyeron herramientas de análisis como líneas de tiempo y grafos de sentimientos, permitiendo visualizar la evolución de percepciones sobre diversos temas y entidades históricas en la Colombia del siglo XIX. El proyecto demuestra la viabilidad de aplicar técnicas modernas de procesamiento de lenguaje natural al análisis de textos históricos, ofreciendo nuevas perspectivas para estudios en humanidades y ciencias sociales, aunque se recomienda ampliar el conjunto de datos etiquetados y explorar nuevas arquitecturas para mejorar la precisión, especialmente en la detección de ironía.PregradoProcesamiento de Lenguaje Natural31 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/embargoedAccesshttp://purl.org/coar/access_right/c_f1cfAplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.Trabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fAudiovisualhttp://purl.org/redcol/resource_type/TPModeloPeriodicoBERTSentimientosIngenieríaAladağ, F. (2023). The Potential of GPT in Ottoman Studies: Computational Analysis of Evliya Çelebi’s Travelogue with NLP and Text Mining and Digital Edition with TEI. https://doi.org/10.13140/RG.2.2.10335.43683Al-Laith, A., Degn, K. N., Conroy, A., Pedersen, B. S., Bjerring-Hansen, J., & Hershcovich, D. (2023). Sentiment Classification of Historical Danish and Norwegian Literary Texts.Finiteautomata/beto-sentiment-analysis · Hugging Face. (n.d.). Retrieved February 12, 2024, from https://huggingface.co/finiteautomata/beto-sentiment-analysisKoncar, P. (n.d.). “A Sentiment Analysis Tool Chain for 18th Century Periodicals” on Melusina Press. Melusina Press. Retrieved February 4, 2024, from https://www.melusinapress.lu/read/ezpg-wk34/section/01ef33d1-8d9d-4391-a488-7d090f719858Koncar, P., Fuchs, A., Hobisch, E., Geiger, B. C., Scholger, M., & Helic, D. (2020). Text sentiment in the Age of Enlightenment: An analysis of spectator periodicals. Applied Network Science, 5(1), 33. https://doi.org/10.1007/s41109-020-00269-zPavlopoulos, J., Xenos, A., & Picca, D. (2022). Sentiment Analysis of Homeric Text: The 1st Book of Iliad.Sprugnoli, R., Tonelli, S., Marchetti, A., & Moretti, G. (2016). Towards sentiment analysis for historical texts. Digital Scholarship in the Humanities, 31(4), 762–772. https://doi.org/10.1093/llc/fqv027201729285Publication9f6e12e0-098e-4548-ab81-75552e8385e7virtual::18829-19f6e12e0-098e-4548-ab81-75552e8385e7virtual::18829-1LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/4b1aed9e-1805-455b-926b-cae59ad2fd05/downloadae9e573a68e7f92501b6913cc846c39fMD51ORIGINALJuanDanielCas.pdfJuanDanielCas.pdfHIDEapplication/pdf377996https://repositorio.uniandes.edu.co/bitstreams/a43f5dfd-068e-46a9-b7a6-415cdfed2bb3/downloaddf8fd344cf52ea0a4664cd79f4d90ab3MD53SentimentAnalysisProject.pdfSentimentAnalysisProject.pdfRestricción de acceso público hasta el año 2025 debido a que los datos usados para el desarrollo del proyecto todavía no se han hecho públicosapplication/pdf2480194https://repositorio.uniandes.edu.co/bitstreams/b7b93d9d-7862-4176-8239-3091b413c9f1/downloadf83b82763c99d28e489a06a89effc145MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/03204873-d34d-4769-b479-7508e1d59525/download0175ea4a2d4caec4bbcc37e300941108MD55TEXTJuanDanielCas.pdf.txtJuanDanielCas.pdf.txtExtracted texttext/plain2https://repositorio.uniandes.edu.co/bitstreams/f0755536-ba9b-4268-a974-237aee1fd9bb/downloade1c06d85ae7b8b032bef47e42e4c08f9MD56SentimentAnalysisProject.pdf.txtSentimentAnalysisProject.pdf.txtExtracted texttext/plain63006https://repositorio.uniandes.edu.co/bitstreams/6f17490b-744c-4e36-be90-e21548ead01b/downloadb73ad86beb483d8557735c0719c3ea68MD58THUMBNAILJuanDanielCas.pdf.jpgJuanDanielCas.pdf.jpgGenerated Thumbnailimage/jpeg11340https://repositorio.uniandes.edu.co/bitstreams/ae8d2ae5-9b0c-4f0a-8cc4-a75ce152dd0f/download9cb00878962ae919e42e64d24178d7f0MD57SentimentAnalysisProject.pdf.jpgSentimentAnalysisProject.pdf.jpgGenerated Thumbnailimage/jpeg7942https://repositorio.uniandes.edu.co/bitstreams/b808640a-7fd7-4e78-882d-88098c97f9ee/download0ac9a694283f02e30c0d87654f874d1aMD591992/74536oai:repositorio.uniandes.edu.co:1992/745362024-07-16 03:06:34.49http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalrestrictedhttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K