Diseño de un modelo matemático para predecir la intención de matrícula en estudiantes de primer ingreso de la Universidad del norte

Actualmente los esfuerzos de seguimiento con respecto a la oficialización del proceso de matrícula, aplicados por la Universidad del Norte sobre los estudiantes admitidos, no se encuentran focalizados sobre aquellas personas cuyas características indican una alta probabilidad de llegar a la instanci...

Full description

Autores:
Pedroza Salgado, Ivana Paola
Pérez Sarabia, Elmer Andrés
Polo Vásquez, Andrea Stephania
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/7972
Acceso en línea:
http://hdl.handle.net/10584/7972
Palabra clave:
Regresión logística
Redes Neuronales Artificiales
Curva ROC
Predicción
Métrica AUC
Artificial neural networks
ROC curve
Prediction
metric AUC
Logistic regression
Rights
License
Universidad del Norte
Description
Summary:Actualmente los esfuerzos de seguimiento con respecto a la oficialización del proceso de matrícula, aplicados por la Universidad del Norte sobre los estudiantes admitidos, no se encuentran focalizados sobre aquellas personas cuyas características indican una alta probabilidad de llegar a la instancia de matrícula, sino sobre toda la población, lo cual genera una alta utilización de los recursos destinados para tal fin. Para dar solución a este problema se llevó a cabo la construcción de modelos de redes neuronales artificiales y regresión logística, con la finalidad de predecir la intención de matrícula de los estudiantes admitidos y direccionar así la labor de seguimiento sobre aquellos estudiantes que según los modelos procederán a matricularse. Los métodos fueron desarrollados partiendo del análisis previo de los datos disponibles, correspondientes a los estudiantes admitidos en pregrado entre los años 2016 y 2017 a partir del cual fueron seleccionadas variables explicativas, tales como, edad, género, forma de financiación, ICFES, departamento de proveniencia, tipo de colegio (colegio público o privado), semestre académico, carrera y estrato. Se empleó el software estadístico SPSS para determinar los parámetros de las técnicas propuestas. Cada uno de los modelos obtenidos presentó un alto carácter diagnóstico, el cual fue contrastado a partir del análisis ROC (Receiver Operating Characteristic), aplicado sobre los datos concernientes a estudiantes admitidos en el primer semestre del año 2018. Este análisis dio como resultado la superioridad del modelo logit por encima del de neuroredes para predecir las instancias correspondientes al periodo 2018-1. Por otra parte, fue posible determinar, a partir del modelo de regresión logística, la manera en cómo cada variable de entrada impacta la variable de respuesta. Finalmente se propone la forma en cómo deben emplearse las salidas de los modelos para llevar a cabo pronósticos relacionados con nuevas observaciones.