Factores claves que describen los resultados de Pruebas Saber 11 en el departamento del Atlántico usando técnicas de analítica de datos

El propósito de este proyecto es aplicar técnicas de análisis de datos a los resultados de las Pruebas Saber 11 del segundo semestre del 2020 para identificar factores que determinan el rendimiento de los estudiantes al momento de realizar la prueba. Dada la problemática que representa el posible ba...

Full description

Autores:
Lozano Hoyos, Jesús Manuel
Padilla Gamarra, José David
Porto Candamil, Cristian Ángel
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/10554
Acceso en línea:
http://hdl.handle.net/10584/10554
Palabra clave:
Análisis de datos
Clasificación
Agrupamiento
Educación
Data analysis
Classification
Clustering
Education
Rights
License
Universidad del Norte
Description
Summary:El propósito de este proyecto es aplicar técnicas de análisis de datos a los resultados de las Pruebas Saber 11 del segundo semestre del 2020 para identificar factores que determinan el rendimiento de los estudiantes al momento de realizar la prueba. Dada la problemática que representa el posible bajo o medio rendimiento en las pruebas presentadas por los estudiantes del departamento, según información basada en resultados de la prueba anteriormente mencionada y en respuestas a preguntas sociales, demográficas y/o económicas realizadas por ICFES a los estudiantes, buscamos deducir o inferir los elementos por los que los estudiantes puedan presentar más dificultades o, por el contrario, los elementos que puedan mejorar el rendimiento de los estudiantes durante la prueba o en el proceso de estudio de la misma. Este informe cumple el propósito de enunciar y describir las etapas por las que atraviesa el proyecto, iniciando por un proceso de investigación, donde se consultan artículos de investigación provenientes de varias fuentes, después de ser sometidos por un proceso de depuración. Segundo, se obtiene y se analiza el conjunto de datos de la página web de datos abiertos de Colombia, el cual contiene resultados anónimos de las Pruebas Saber 11 del segundo semestre del 2020. Tercero, algunos de los atributos pasan por varios algoritmos de pre-procesado, como la separación de los datos provenientes de otros departamentos, o la asignación de valores numéricos a atributos no numéricos. Cuarto, se aplican a los datos ya "limpios" los algoritmos de clustering necesarios para poder visualizar los datos según las variables de interés. Por último, se evidencian los resultados y las conclusiones derivadas de estos.