Aplicación de técnicas de minería de datos para el análisis de los factores socioculturales que determinan el puntaje de las pruebas saber 11 del año 2018, 2019 y 2020
Esta propuesta tiene como meta, mostrar los diferentes procesos de indagación que se aplicarán para el desarrollo de patrones de datos, utilizando técnicas de minería de datos a tres datasets (pruebas SABER 11 de los años 2018, 2019 y 2020), los cuales fueron obtenidos haciendo uso de la plataforma...
- Autores:
-
Novoa Montenegro, Andrés Felipe
Gómez Torres, Cristhian Mauricio
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad de Ibagué
- Repositorio:
- Repositorio Universidad de Ibagué
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unibague.edu.co:20.500.12313/3812
- Acceso en línea:
- https://hdl.handle.net/20.500.12313/3812
- Palabra clave:
- Pruebas saber 11 2018-2020 - Minería de datos
Pruebas saber 11 2018-2020 - Factores socioculturales - Puntaje
Pruebas saber 11 2018-2020 - Factores socioculturales - Análisis
Saber 11,
Visual Studio
Dataset
ICFES
Patrones
Minería de datos
Árboles de decisión
Saber 11
Visual Studio
Dataset
ICFES
Patterns
Data mining
Decision trees
- Rights
- openAccess
- License
- http://purl.org/coar/access_right/c_abf2
Summary: | Esta propuesta tiene como meta, mostrar los diferentes procesos de indagación que se aplicarán para el desarrollo de patrones de datos, utilizando técnicas de minería de datos a tres datasets (pruebas SABER 11 de los años 2018, 2019 y 2020), los cuales fueron obtenidos haciendo uso de la plataforma ICFES. Con los datasets obtenidos, se espera llegar a resultados específicos que indiquen los diferentes factores socioculturales que afectan los distintos puntajes de los estudiantes en los departamentos del Tolima, Huila y Caquetá. Se hará uso de tres datasets de las pruebas SABER 11 de los años 2018, 2019 y 2020, los cuales poseen: 549.936 el del año 2018, 546.213 para el año 2019 y 504.783 del año 2020. De igual manera se planea aplicar dichos registros en un motor de bases de datos relacionales, en este caso se usará SQL SERVER, esto para agilizar los procesos necesarios en el tratamiento de la información. Una vez procesado los datos de manera correcta, se implementarán en la herramienta de análisis de datos que se usarán, para este trabajo se usara un software llamado Visual Studio 2019 con una extensión para el análisis de datos llamada “Proyectos de modelado de Microsoft Analysis Services”, el cual permite visualizar los datos con diferentes técnicas de minería de datos como árboles de decisión, clustering y reglas de asociación. Finalizando se mostrarán los resultados obtenidos para sus respectivas conclusiones. |
---|