Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto

Las entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de...

Full description

Autores:
Parra Moreno, Juan Camilo
Espinosa Orjuela, Paola Andrea
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2021
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/41225
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/41225
https://noesis.uis.edu.co
Palabra clave:
Minería de datos
Aprendizaje automático
Algoritmos
Analítica de datos
Metodología KDD
aprendizaje no supervisado
aprendizaje supervisado
Data mining
Machine learning
Algorithms
Data analytics
KDD Methodology
unsupervised learning
supervised learning
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
Description
Summary:Las entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de políticas públicas .En este artículo se explora la aplicación de la metodología KDD (Knowledge Discovery in Databases) a una base de datos que contiene los resultados del examen Saber Pro2019 publicados por el ICFES. Se realizaron análisis estadísticos y matemáticos a las variables consideradas de interés, se ajustó un modelo de clasificación a Instituciones de Educación Superior (IES) , se agruparon los estudiantes por medio de una clasificación socioeconómica y se crearon los perfiles tipológicos de cada grupo. Adicionalmente, se estudió la relación entre la clasificación socioeconómica, la institución de educación superior y el puntaje global por medio de un árbol de decisión. Por último, se realizó un análisis de sentimientos y se construyeron nubes de palabras con base a los resultados de una encuesta relacionada con las pruebas saber Pro. Se concluye que la categoría socioeconómica si es una variable con significancia estadística sobre el puntaje global, sin embargo, su influencia se ve trivializada en comparación con el efecto de la institución de educación superior con el puntaje. También se observa que hay una mayor proporción de estudiantes con categorías socioeconómicas más altas conforme aumenta la categoría la universidad. 1*