Aplicación de técnicas de minería de datos para el análisis de los factores socioculturales que determinan el puntaje de las pruebas saber 11 del año 2018, 2019 y 2020

Esta propuesta tiene como meta, mostrar los diferentes procesos de indagación que se aplicarán para el desarrollo de patrones de datos, utilizando técnicas de minería de datos a tres datasets (pruebas SABER 11 de los años 2018, 2019 y 2020), los cuales fueron obtenidos haciendo uso de la plataforma...

Full description

Autores:
Novoa Montenegro, Andrés Felipe
Gómez Torres, Cristhian Mauricio
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de Ibagué
Repositorio:
Repositorio Universidad de Ibagué
Idioma:
spa
OAI Identifier:
oai:repositorio.unibague.edu.co:20.500.12313/3812
Acceso en línea:
https://hdl.handle.net/20.500.12313/3812
Palabra clave:
Pruebas saber 11 2018-2020 - Minería de datos
Pruebas saber 11 2018-2020 - Factores socioculturales - Puntaje
Pruebas saber 11 2018-2020 - Factores socioculturales - Análisis
Saber 11,
Visual Studio
Dataset
ICFES
Patrones
Minería de datos
Árboles de decisión
Saber 11
Visual Studio
Dataset
ICFES
Patterns
Data mining
Decision trees
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2
Description
Summary:Esta propuesta tiene como meta, mostrar los diferentes procesos de indagación que se aplicarán para el desarrollo de patrones de datos, utilizando técnicas de minería de datos a tres datasets (pruebas SABER 11 de los años 2018, 2019 y 2020), los cuales fueron obtenidos haciendo uso de la plataforma ICFES. Con los datasets obtenidos, se espera llegar a resultados específicos que indiquen los diferentes factores socioculturales que afectan los distintos puntajes de los estudiantes en los departamentos del Tolima, Huila y Caquetá. Se hará uso de tres datasets de las pruebas SABER 11 de los años 2018, 2019 y 2020, los cuales poseen: 549.936 el del año 2018, 546.213 para el año 2019 y 504.783 del año 2020. De igual manera se planea aplicar dichos registros en un motor de bases de datos relacionales, en este caso se usará SQL SERVER, esto para agilizar los procesos necesarios en el tratamiento de la información. Una vez procesado los datos de manera correcta, se implementarán en la herramienta de análisis de datos que se usarán, para este trabajo se usara un software llamado Visual Studio 2019 con una extensión para el análisis de datos llamada “Proyectos de modelado de Microsoft Analysis Services”, el cual permite visualizar los datos con diferentes técnicas de minería de datos como árboles de decisión, clustering y reglas de asociación. Finalizando se mostrarán los resultados obtenidos para sus respectivas conclusiones.