Aplicabilidad de los algoritmos de clasificación de sentimientos sobre prensa antigua en español.
Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los mode...
- Autores:
-
Castrellón Botero, Juan Daniel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/74536
- Acceso en línea:
- https://hdl.handle.net/1992/74536
- Palabra clave:
- Modelo
Periodico
BERT
Sentimientos
Ingeniería
- Rights
- embargoedAccess
- License
- Attribution 4.0 International
Summary: | Este proyecto investiga la aplicabilidad de algoritmos de clasificación de sentimientos en textos periodísticos colombianos del siglo XIX, entrenando 22 modelos de lenguaje basados en BERT con un corpus de aproximadamente 2700 documentos etiquetados manualmente. Los resultados revelaron que los modelos entrenados en textos antiguos superaron a los modernos, logrando el mejor modelo una precisión del 65% en la clasificación de sentimientos positivos, negativos y neutros, aunque la detección de ironía resultó desafiante. Con el modelo desarrollado, se construyeron herramientas de análisis como líneas de tiempo y grafos de sentimientos, permitiendo visualizar la evolución de percepciones sobre diversos temas y entidades históricas en la Colombia del siglo XIX. El proyecto demuestra la viabilidad de aplicar técnicas modernas de procesamiento de lenguaje natural al análisis de textos históricos, ofreciendo nuevas perspectivas para estudios en humanidades y ciencias sociales, aunque se recomienda ampliar el conjunto de datos etiquetados y explorar nuevas arquitecturas para mejorar la precisión, especialmente en la detección de ironía. |
---|