Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.

Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los mode...

Full description

Autores:
Castrellón Botero, Juan Daniel
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/74536
Acceso en línea:
https://hdl.handle.net/1992/74536
Palabra clave:
Modelo
Periodico
BERT
Sentimientos
Ingeniería
Rights
embargoedAccess
License
Attribution 4.0 International
Description
Summary:Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los modelos entrenados en textos antiguos superaron a los modernos, logrando el mejor modelo una precisión del 65% en la clasificación de sentimientos positivos, negativos y neutros, aunque la detección de ironía resultó desafiante. Con el modelo desarrollado, se construyeron herramientas de análisis como líneas de tiempo y grafos de sentimientos, permitiendo visualizar la evolución de percepciones sobre diversos temas y entidades históricas en la Colombia del siglo XIX. El proyecto demuestra la viabilidad de aplicar técnicas modernas de procesamiento de lenguaje natural al análisis de textos históricos, ofreciendo nuevas perspectivas para estudios en humanidades y ciencias sociales, aunque se recomienda ampliar el conjunto de datos etiquetados y explorar nuevas arquitecturas para mejorar la precisión, especialmente en la detección de ironía.