Predicción del puntaje global en la prueba Saber 11 mediante técnicas de Machine learning

Este trabajo de grado se centra en la aplicación de técnicas de machine learning, específicamente regresión lineal, para predecir el puntaje global en la prueba Saber 11 con base en una extensa base de datos que abarca el período 2019-2022 y comprende 296,343 registros de estudiantes del departament...

Full description

Autores:
Giraldo Osorio, Diego Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Corporación Universitaria Remington
Repositorio:
Repositorio institucional Uniremington
Idioma:
spa
OAI Identifier:
oai:repositorio.uniremington.edu.co:123456789/2125
Acceso en línea:
https://repositorio.uniremington.edu.co/handle/123456789/2125
Palabra clave:
Machine learning
Regresión lineal
Prueba saber 11
Predicción
Educación
Aprendizaje automático (Inteligencia artificial)
Análisis de regresión
Prueba nacional
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:Este trabajo de grado se centra en la aplicación de técnicas de machine learning, específicamente regresión lineal, para predecir el puntaje global en la prueba Saber 11 con base en una extensa base de datos que abarca el período 2019-2022 y comprende 296,343 registros de estudiantes del departamento de Antioquia. La base de datos incluye diversas variables explicativas, como el área del colegio (urbano, rural), la condición bilingüe del colegio, el municipio del colegio, la edad del estudiante, la cantidad de cuartos en el hogar, el nivel educativo de los padres, el estrato socioeconómico, la posesión de automóvil, la disponibilidad de computador e internet, entre otras. Estas variables proporcionan un panorama completo de las condiciones socioeconómicas y educativas de los estudiantes, permitiendo una evaluación integral de su entorno. La metodología se basa en la implementación de un modelo de regresión lineal que utiliza estas variables como predictores del puntaje global en la prueba Saber 11. La elección de la regresión lineal se fundamenta en su capacidad para modelar relaciones lineales entre variables, lo que facilita la interpretación de la contribución relativa de cada factor al rendimiento estudiantil.