Propuesta de un modelo estadístico para caracterizar y predecir la deserción estudiantil Universitaria

El objetivo de la investigación se fundamentó en utilizar técnicas estadísticas multivariadas: Máquinas Vector Soporte (SVM), Análisis Discriminante (AD), K-vecinos más próximos (KNN) y Regresión Logística (RL) para clasificar a los estudiantes de pregrado de la Universidad Nacional de Colombia Sede...

Full description

Autores:
Madrid Echeverry, Jorge Iván
Tipo de recurso:
Fecha de publicación:
2017
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/60097
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/60097
http://bdigital.unal.edu.co/58059/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Deserción Universitaria
Estadística Multivariada
Máquina Vector Soporte
Análisis Discriminante
Regresión logística
University Desertion,
Multivariate Statistics
Support Vector Machines
Discriminant Analysis,
Logistic Regression.
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:El objetivo de la investigación se fundamentó en utilizar técnicas estadísticas multivariadas: Máquinas Vector Soporte (SVM), Análisis Discriminante (AD), K-vecinos más próximos (KNN) y Regresión Logística (RL) para clasificar a los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medellín en dos poblaciones (con posibilidad o no de desertar) a partir de la información que se tenía disponible de las variables definidas e identificadas como determinantes de la deserción estudiantil Universitaria. Para el estudio se utilizó la información que suministraron los estudiantes que ingresaron a la Universidad Nacional de Colombia Sede Medellín desde el primer semestre del año 2009 hasta el primer semestre del año 2016, su correspondiente rendimiento académico en cada periodo matriculado y la identificación de cuáles de ellos perdieron la calidad de estudiante en la Universidad por bajo rendimiento y cuáles continuaron con sus estudios. Lo que permitió contar con un porcentaje de datos que fueron utilizados para el entrenamiento de los modelos y el resto de los datos como validación. Los resultados permitieron identificar la técnica que permite obtener el modelo con menor porcentaje de error y mayor sensibilidad, y que podría ser utilizada para hacer predicciones de deserción en nuevos individuos a partir de la información de las variables seleccionadas.