Creación de un conjunto de datos para el entrenamiento de un modelo de aprendizaje automático capaz de detectar noticias falsas de Colombia escirtas en español desde la perspectiva del periodismo de datos
Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este...
- Autores:
-
Pérez León, Camila Andrea
López González, Brayan Arnulfo
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad Distrital Francisco José de Caldas
- Repositorio:
- RIUD: repositorio U. Distrital
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udistrital.edu.co:11349/93187
- Acceso en línea:
- http://hdl.handle.net/11349/93187
- Palabra clave:
- Noticias falsas
Posverdad
Periodismo de datos
Conjunto de datos
Aprendizaje automático
Ciencia de datos
Comunicación Social y Periodismo -- Tesis y Disertaciones Académicas
Periodismo en línea
Redes sociales -- Investigaciones
Noticias falsas -- Investigaciones
Fake News
Data Set
Data Science
Post-truth
Machine Learning
Data Journalism
- Rights
- License
- Abierto (Texto Completo)
Summary: | Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este contexto, se ve necesario adoptar nuevas tecnologías en la labor del periodista; la inteligencia artificial resulta una herramienta de mucha utilidad. El presente proyecto se enfoca en desarrollar un conjunto de datos de noticias falsas escritas en español que puedan ser utilizados para entrenar un modelo de aprendizaje automático capaz de clasificar noticias de forma precisa. La creación de un conjunto de datos de noticias falsas en español es un desafío importante debido a la necesidad de garantizar la calidad y la representatividad de los datos que permitan entrenar un modelo efectivo. Para esto se contará con las bases propuestas por el periodismo de datos, siendo esta un área donde converge el conocimiento del periodista y las ciencias de datos. |
---|