Análisis de resultados de las pruebas saber 11 implementando técnicas de minería de datos.

Pruebas estandarizadas como la Saber 11 en Colombia permiten medir el nivel académico de la población estudiantil que finaliza su etapa escolar, los resultados pueden ser aprovechados para implementar políticas educativas en un país y además se le suma la importancia que ha tomado en la actualidad p...

Full description

Autores:
Ávila Palacio, Luis Kener
Ospino Gutiérrez, Emanuel
Páez Reales, Arlinton José
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/9877
Acceso en línea:
http://hdl.handle.net/10584/9877
Palabra clave:
Minería de datos
Minería de datos educativa
Análisis
Pruebas Saber 11
Educación en Colombia
Variables socioeconómicas
Data mining
Educational data mining
Analysis
Saber 11 tests
Colombian education
Socioeconomic variables
Rights
License
Universidad del Norte
Description
Summary:Pruebas estandarizadas como la Saber 11 en Colombia permiten medir el nivel académico de la población estudiantil que finaliza su etapa escolar, los resultados pueden ser aprovechados para implementar políticas educativas en un país y además se le suma la importancia que ha tomado en la actualidad para acceder a la educación superior. Aplicar técnicas de minería de datos sobre los datasets de libre acceso de las ICFES facilitará la obtención de información oculta que cualquier institución puede aprovechar para hacer más eficientes sus procesos. Este proyecto se centra en la investigación e implementación de un modelo machine learning usamos algoritmos de aprendizaje supervisado que permite analizar los resultados de las pruebas saber 11 en Colombia, interpretando las diferentes variables socioeconómicas para hallar relación con los puntajes obtenidos por los estudiantes. Usamos los árboles de decisión para generar reglas de clasificación, dicha clasificación tiene dos categorías, una es “Por encima de la media” y la otra es “Por debajo de la media”, también hacemos uso del algoritmo de regresión SGD Regressor para ver el impacto de las variables socioeconómicas en el puntaje global y adicionalmente se desarrolló una aplicación web para integrar los resultados del modelo de clasificación y contenido adicional como gráficas y análisis de los resultados obtenidos en la pruebas saber 11 desde el periodo 2017-1 hasta 2021-1. Este proyecto no tiene en cuenta indicadores académicos de los estudiantes ni de los colegios para realizar las clasificaciones y los análisis, se busca realizar interpretaciones solo de tipo descriptivo con la información que está disponible. Finalmente los resultados encontrados permiten ver el panorama del país con respecto a estas pruebas y que no se debe de tomar literalmente los resultados arrojados puesto que se puede incurrir en una malinterpretación que terminaría siendo perjudicial para colegios, estudiantes o personas involucradas.