Aplicación de minería de datos para predecir la deserción estudiantil en la facultad de ingeniera de la Universidad del Magdalena

El presente trabajo es un reporte final de los resultados obtenidos al emplear métodos de aprendizaje de máquinas para predecir el riesgo de deserción de los estudiantes de la Facultad de Ingeniería de la Universidad del Magdalena. En el desarrollo del proyecto se llevaron a cabo diferentes etapas p...

Full description

Autores:
Gonzalez Danies, Janer Alberto
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad del Magdalena
Repositorio:
Repositorio Unimagdalena
Idioma:
spa
OAI Identifier:
oai:repositorio.unimagdalena.edu.co:123456789/6647
Acceso en línea:
http://repositorio.unimagdalena.edu.co/handle/123456789/6647
Palabra clave:
Minería de datos
Machine learning
Facultad Ingenieria
Aprendizaje automatico
Redes neuronales
Deserción académica
Random forest
Rights
openAccess
License
atribucionnocomercialsinderivar
Description
Summary:El presente trabajo es un reporte final de los resultados obtenidos al emplear métodos de aprendizaje de máquinas para predecir el riesgo de deserción de los estudiantes de la Facultad de Ingeniería de la Universidad del Magdalena. En el desarrollo del proyecto se llevaron a cabo diferentes etapas propias de un proceso de minería de datos, desde la recopilación de datos, limpieza y preparación, extracción de características, y la aplicación de métodos de aprendizaje de máquinas supervisado. La principal fuente de datos utilizada en el proyecto fue el sistema de información de admisiones y registro de la Universidad, del cual se incluyeron tanto variables de tipo socio-demográficas como de tipo académico de una muestra de estudiantes de la Facultad de Ingenieria, registrados en un periodo de tiempo del 2014 hasta 2019. La muestra que se conformó contiene casos de estudiantes que no culminaron sus estudios, y estudiantes cuyo proceso de formación no se había visto en riesgo hasta la fecha de recopilación de los datos. Los datos recopilados fueron sometidos a diferentes procesos de limpieza y transformación para constituir un conjunto de datos que permitiera utilizar métodos de aprendizaje de máquinas no supervisados, y supervisados. En este trabajo se utilizaron métodos de aprendizaje no supervisado para encontrar estructuras y patrones en los datos que no son aparentemente observables; sin embargo, ninguno de los métodos implementados generó grupos compactos u homogéneos. Por otra parte, los métodos de aprendizaje supervisado generaron modelos de predicción prometedores, alcanzado tasas de precisión por encima del 95%, especialmente el random forest, y el método los k-vecinos más cercanos. A partir de estos resultados se puede concluir que sería posible emplear los modelos de predicción generados por estos métodos para predecir de manera temprana el riesgo de un estudiante de desertar en la Facultad de Ingeniería