Diseño de una herramienta en Python para el análisis de resultados de pruebas Saber Pro

Este proyecto consiste en el diseño de una herramienta que se implementará en Python, que permita aprovechar en mayor medida toda la información que ofrecen los resultados de las pruebas Saber Pro. Se desea diseñar una herramienta que permita encontrar si los factores económicos, sociales y demográf...

Full description

Autores:
Pinzón Montaño, Jorge A.
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/8774
Acceso en línea:
http://hdl.handle.net/10584/8774
Palabra clave:
Pruebas Saber Pro
Python
Analísis de datos
Chi cuadrado
Cochran-Mantel-Haenszel
Saber Pro Test
Python
Data Analysis
Chi squared
Cochran-Mantel-Haenszel
Rights
License
Universidad del Norte
Description
Summary:Este proyecto consiste en el diseño de una herramienta que se implementará en Python, que permita aprovechar en mayor medida toda la información que ofrecen los resultados de las pruebas Saber Pro. Se desea diseñar una herramienta que permita encontrar si los factores económicos, sociales y demográficos que recopilados por la prueba Saber Pro afectan el desempeño de los estudiantes de Ingeniería de Sistemas a nivel nacional. Para lograrlo se implementó un algoritmo en Python que en primera instancia tenía una función que permitía limpiar la data de tal forma que no se encontrara ningún tipo de anomalía que pudiera generar errores en el procesamiento posterior. Luego procesaba la data para seleccionar la información relacionada con las ciudades de Barranquilla, Bogotá y Medellín, y los programas de Ingeniería de Sistemas. Seguido a esto, comparaba las características de la data a través de los años para determinar cuales se repetían y se agrupaba los estudiantes en cuartiles teniendo en cuenta su puntaje obtenido en la prueba Saber Pro. Posteriormente, se diseñó un algoritmo que generaba tablas de contingencia para relacionar las variables categóricas (X) obtenidas anteriormente con respecto a los cuartiles (Y), y con base a esto se diseñó un algoritmo que permitía evaluar la independencia entre estas usando la prueba de Chi-Cuadrado con un nivel de significancia del 0.05, para determinar si existía algún tipo de relación entre ellos. Así mismo, se realizó otro algoritmo el cual generaba una tabla estratificada donde se relaciona la ciudad, el género y el resultado en cuartiles, para luego utilizar estos datos en otro algoritmo que incluía la implementación de la prueba de independencia de Cochran-Mantel-Haenszel y generaba un resultado con respecto a esta prueba. Finalmente, basándose en los resultados obtenidos por medio de los algoritmos diseñados se determinó cuáles de estas características afectan el desempeño de los estudiantes en la prueba Saber Pro.