Creación de un conjunto de datos para el entrenamiento de un modelo de aprendizaje automático capaz de detectar noticias falsas de Colombia escirtas en español desde la perspectiva del periodismo de datos

Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este...

Full description

Autores:
Pérez León, Camila Andrea
López González, Brayan Arnulfo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/93187
Acceso en línea:
http://hdl.handle.net/11349/93187
Palabra clave:
Noticias falsas
Posverdad
Periodismo de datos
Conjunto de datos
Aprendizaje automático
Ciencia de datos
Comunicación Social y Periodismo -- Tesis y Disertaciones Académicas
Periodismo en línea
Redes sociales -- Investigaciones
Noticias falsas -- Investigaciones
Fake News
Data Set
Data Science
Post-truth
Machine Learning
Data Journalism
Rights
License
Abierto (Texto Completo)
Description
Summary:Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este contexto, se ve necesario adoptar nuevas tecnologías en la labor del periodista; la inteligencia artificial resulta una herramienta de mucha utilidad. El presente proyecto se enfoca en desarrollar un conjunto de datos de noticias falsas escritas en español que puedan ser utilizados para entrenar un modelo de aprendizaje automático capaz de clasificar noticias de forma precisa. La creación de un conjunto de datos de noticias falsas en español es un desafío importante debido a la necesidad de garantizar la calidad y la representatividad de los datos que permitan entrenar un modelo efectivo. Para esto se contará con las bases propuestas por el periodismo de datos, siendo esta un área donde converge el conocimiento del periodista y las ciencias de datos.