Factores claves que describen los resultados de Pruebas Saber 11 en el departamento del Atlántico usando técnicas de analítica de datos
El propósito de este proyecto es aplicar técnicas de análisis de datos a los resultados de las Pruebas Saber 11 del segundo semestre del 2020 para identificar factores que determinan el rendimiento de los estudiantes al momento de realizar la prueba. Dada la problemática que representa el posible ba...
- Autores:
-
Lozano Hoyos, Jesús Manuel
Padilla Gamarra, José David
Porto Candamil, Cristian Ángel
- Tipo de recurso:
- Fecha de publicación:
- 2022
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/10554
- Acceso en línea:
- http://hdl.handle.net/10584/10554
- Palabra clave:
- Análisis de datos
Clasificación
Agrupamiento
Educación
Data analysis
Classification
Clustering
Education
- Rights
- License
- Universidad del Norte
Summary: | El propósito de este proyecto es aplicar técnicas de análisis de datos a los resultados de las Pruebas Saber 11 del segundo semestre del 2020 para identificar factores que determinan el rendimiento de los estudiantes al momento de realizar la prueba. Dada la problemática que representa el posible bajo o medio rendimiento en las pruebas presentadas por los estudiantes del departamento, según información basada en resultados de la prueba anteriormente mencionada y en respuestas a preguntas sociales, demográficas y/o económicas realizadas por ICFES a los estudiantes, buscamos deducir o inferir los elementos por los que los estudiantes puedan presentar más dificultades o, por el contrario, los elementos que puedan mejorar el rendimiento de los estudiantes durante la prueba o en el proceso de estudio de la misma. Este informe cumple el propósito de enunciar y describir las etapas por las que atraviesa el proyecto, iniciando por un proceso de investigación, donde se consultan artículos de investigación provenientes de varias fuentes, después de ser sometidos por un proceso de depuración. Segundo, se obtiene y se analiza el conjunto de datos de la página web de datos abiertos de Colombia, el cual contiene resultados anónimos de las Pruebas Saber 11 del segundo semestre del 2020. Tercero, algunos de los atributos pasan por varios algoritmos de pre-procesado, como la separación de los datos provenientes de otros departamentos, o la asignación de valores numéricos a atributos no numéricos. Cuarto, se aplican a los datos ya "limpios" los algoritmos de clustering necesarios para poder visualizar los datos según las variables de interés. Por último, se evidencian los resultados y las conclusiones derivadas de estos. |
---|