Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior

Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Rosario
Repositorio:
Repositorio EdocUR - U. Rosario
Idioma:
spa
OAI Identifier:
oai:repository.urosario.edu.co:10336/42433
Acceso en línea:
https://repository.urosario.edu.co/handle/10336/42433
Palabra clave:
Saber 11
Saber Pro
Resultados
Área del conocimiento
Modelo analítico predictivo
Metodología CRISP-DM
Saber 11
Saber Pro
Results
Knowledge area
Predictive analytical model
CRISP-DM methodology
Rights
License
Attribution-ShareAlike 4.0 International
id EDOCUR2_d40eb05a70730e016a7c6488724eb921
oai_identifier_str oai:repository.urosario.edu.co:10336/42433
network_acronym_str EDOCUR2
network_name_str Repositorio EdocUR - U. Rosario
repository_id_str
dc.title.none.fl_str_mv Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
dc.title.TranslatedTitle.none.fl_str_mv Designing a predictive model for academic performance of students entering higher education
title Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
spellingShingle Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
Saber 11
Saber Pro
Resultados
Área del conocimiento
Modelo analítico predictivo
Metodología CRISP-DM
Saber 11
Saber Pro
Results
Knowledge area
Predictive analytical model
CRISP-DM methodology
title_short Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
title_full Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
title_fullStr Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
title_full_unstemmed Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
title_sort Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
dc.contributor.advisor.none.fl_str_mv Calvo López, John Pablo
dc.subject.none.fl_str_mv Saber 11
Saber Pro
Resultados
Área del conocimiento
Modelo analítico predictivo
Metodología CRISP-DM
topic Saber 11
Saber Pro
Resultados
Área del conocimiento
Modelo analítico predictivo
Metodología CRISP-DM
Saber 11
Saber Pro
Results
Knowledge area
Predictive analytical model
CRISP-DM methodology
dc.subject.keyword.none.fl_str_mv Saber 11
Saber Pro
Results
Knowledge area
Predictive analytical model
CRISP-DM methodology
description Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de la Salud, Ciencias Sociales y Humanas, Economía, Administración, Contaduría, Ingeniería, Arquitectura, Urbanismo, Matemáticas y Ciencias Naturales. Estos modelos tienen como objetivo identificar y jerarquizar las áreas de estudio con mayor influencia en el rendimiento en las pruebas, proporcionando orientación para la toma de decisiones relacionadas con el ingreso a la educación superior. Los modelos se basan en los resultados obtenidos en las pruebas Saber 11 y Saber Pro en Colombia, que evalúan las competencias generales y específicas de los estudiantes de bachillerato y universitarios. Se centran en la identificación de variables socioeconómicas, educativas y de desempeño académico relevantes para anticipar el éxito de los estudiantes en la educación superior. El desarrollo de estos modelos predictivos seguirá la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), que consta de seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. La aplicación de esta metodología garantizará un análisis de los datos de las pruebas Saber, asegurando la calidad del modelo predictivo y evaluando su efectividad mediante indicadores de precisión. En última instancia, el modelo propuesto brindará a los estudiantes que cuenten con resultados de la prueba Saber 11 una estimación del puntaje de desempeño en las pruebas Saber Pro para cada área del conocimiento en la educación superior. Este enfoque permitirá que los estudiantes tomen decisiones informadas y basadas en datos al seleccionar su área de estudio, lo que optimizará sus posibilidades de éxito en la educación superior.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-04-12T13:49:28Z
dc.date.available.none.fl_str_mv 2024-04-12T13:49:28Z
dc.date.created.none.fl_str_mv 2024-03-21
dc.type.none.fl_str_mv bachelorThesis
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.document.none.fl_str_mv Trabajo de grado
dc.type.spa.none.fl_str_mv Trabajo de grado
dc.identifier.uri.none.fl_str_mv https://repository.urosario.edu.co/handle/10336/42433
url https://repository.urosario.edu.co/handle/10336/42433
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Attribution-ShareAlike 4.0 International
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.acceso.none.fl_str_mv Abierto (Texto Completo)
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-sa/4.0/
rights_invalid_str_mv Attribution-ShareAlike 4.0 International
Abierto (Texto Completo)
http://creativecommons.org/licenses/by-sa/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 94 pp
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad del Rosario
dc.publisher.department.none.fl_str_mv Escuela de Administración
Escuela de Ingeniería, Ciencia y Tecnología
dc.publisher.program.none.fl_str_mv Maestría en Business Analytics
publisher.none.fl_str_mv Universidad del Rosario
institution Universidad del Rosario
dc.source.bibliographicCitation.none.fl_str_mv Banco Mundial. (2017, mayo 17). Graduarse: Solo la mitad lo logra en América Latina. World Bank. https://www.bancomundial.org/es/news/feature/2017/05/17/graduating-only-half-of-latin-american-students-manage-to-do-so
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS inc, 9(13).
Gaurav. (2021, junio 12). An Introduction to Gradient Boosting Decision Trees. Machine Learning Plus. https://www.machinelearningplus.com/machine-learning/an-introduction-to-gradient-boosting-decision-trees/
Han, J. (2006). Data Mining: Concepts and Techniques. Elsevier.
Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación McGraw-Hill.
Kohavi, R., Rothleder, N. J., & Simoudis, E. (2002). Emerging trends in business analytics. Communications of the ACM, 45(8).
Patel, A. (2020, marzo 18). Stacking -Ensemble meta Algorithms for improve predictions. ML Research Lab. https://medium.com/ml-research-lab/stacking-ensemble-meta-algorithms-for-improve-predictions-f4b4cf3b9237
¿Qué es KNN? | IBM. (s. f.). ¿Qué es KNN? | IBM. Recuperado 25 de octubre de 2023, de https://www.ibm.com/mx-es/topics/knn
Ridge Regression Explained, Step by Step. (2021, mayo 23). Ridge Regression Explained, Step by Step. Machine Learning Compass.
https://machinelearningcompass.com/machine_learning_models/ridge_regression/
Team Dst, D. (2022, enero 25). Random Forest: Bosque aleatorio. Definición y funcionamiento. Formation Data Science | DataScientest.com. https://datascientest.com/es/random-forest-bosque-aleatorio-definicion-y-funcionamiento
Williamson, B. (2018). Big data en educación: El futuro digital del aprendizaje, la política y la práctica. Ediciones Morata.
Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE transactions on knowledge and data engineering, 26(1).
dc.source.instname.none.fl_str_mv instname:Universidad del Rosario
dc.source.reponame.none.fl_str_mv reponame:Repositorio Institucional EdocUR
bitstream.url.fl_str_mv https://repository.urosario.edu.co/bitstreams/4f2a0adf-6736-46e9-b1a6-fa1b05e14354/download
https://repository.urosario.edu.co/bitstreams/2fea00ac-afcf-448c-9dce-72f88f566e71/download
https://repository.urosario.edu.co/bitstreams/6be0dce3-39da-418c-9c0a-273a3a4db311/download
https://repository.urosario.edu.co/bitstreams/ee31dc86-fb2c-4e7d-bfae-5ca0a95d17a8/download
https://repository.urosario.edu.co/bitstreams/c1983d89-d449-4916-90f1-9f6c0a1ff4cf/download
https://repository.urosario.edu.co/bitstreams/db079620-4a8e-4af1-b685-58b7ed3b002a/download
bitstream.checksum.fl_str_mv b2825df9f458e9d5d96ee8b7cd74fde6
adb7af3ef071a784ffe1b544b9a344ab
4a9d1c2ce6331569609099c7e9a212e6
78e801b191097c630525b795f4fa42e3
a6adbd8ea203eb56e212bc0d0f950af8
acd443028ab29a4982f879f49f196636
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional EdocUR
repository.mail.fl_str_mv edocur@urosario.edu.co
_version_ 1814167450174881792
spelling Calvo López, John Pablo0bf1638c-a12e-4cf9-876a-ce604568a9ef-1Soto Dueñas, José LuisAcevedo Tarazona, Sindy YulianaMagíster en Business AnalyticsFull time8e9cdea3-594b-4d5a-aac8-e8391de5b98f-126eb78eb-b14e-4640-ad57-39f86e284d22-12024-04-12T13:49:28Z2024-04-12T13:49:28Z2024-03-21Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de la Salud, Ciencias Sociales y Humanas, Economía, Administración, Contaduría, Ingeniería, Arquitectura, Urbanismo, Matemáticas y Ciencias Naturales. Estos modelos tienen como objetivo identificar y jerarquizar las áreas de estudio con mayor influencia en el rendimiento en las pruebas, proporcionando orientación para la toma de decisiones relacionadas con el ingreso a la educación superior. Los modelos se basan en los resultados obtenidos en las pruebas Saber 11 y Saber Pro en Colombia, que evalúan las competencias generales y específicas de los estudiantes de bachillerato y universitarios. Se centran en la identificación de variables socioeconómicas, educativas y de desempeño académico relevantes para anticipar el éxito de los estudiantes en la educación superior. El desarrollo de estos modelos predictivos seguirá la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), que consta de seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. La aplicación de esta metodología garantizará un análisis de los datos de las pruebas Saber, asegurando la calidad del modelo predictivo y evaluando su efectividad mediante indicadores de precisión. En última instancia, el modelo propuesto brindará a los estudiantes que cuenten con resultados de la prueba Saber 11 una estimación del puntaje de desempeño en las pruebas Saber Pro para cada área del conocimiento en la educación superior. Este enfoque permitirá que los estudiantes tomen decisiones informadas y basadas en datos al seleccionar su área de estudio, lo que optimizará sus posibilidades de éxito en la educación superior.This project focuses on the development of predictive models to assess the performance of students in the Saber Pro tests, with an emphasis on specific knowledge areas in higher education, including Agronomy, Veterinary Sciences, Fine Arts, Education Sciences, Health Sciences, Social and Human Sciences, Economics, Management, Accounting, Engineering, Architecture, Urbanism, Mathematics, and Natural Sciences. These models aim to identify and prioritize the areas of study that have the most significant influence on performance in the tests, providing guidance for decisions related to entering higher education. The models are based on the results obtained in the Saber 11 and Saber Pro tests in Colombia, which evaluate the general and specific competencies of high school and university students. They focus on identifying socio-economic, educational, and academic performance variables that are relevant in predicting students' success in higher education. The development of these predictive models will follow the CRISP-DM methodology (Cross-Industry Standard Process for Data Mining), which comprises six phases: understanding the problem, understanding the data, data preparation, modeling, evaluation, and deployment. The application of this methodology will ensure a rigorous analysis of the Saber test data, ensuring the quality of the predictive model and evaluating its effectiveness through precision indicators. Ultimately, the proposed model will provide students with Saber 11 results with an estimation of their performance score in the Saber Pro tests for each knowledge area in higher education. This approach will enable students to make informed, data-driven decisions when selecting their field of study, thereby optimizing their chances of success in higher education.94 ppapplication/pdfhttps://repository.urosario.edu.co/handle/10336/42433spaUniversidad del RosarioEscuela de AdministraciónEscuela de Ingeniería, Ciencia y TecnologíaMaestría en Business AnalyticsAttribution-ShareAlike 4.0 InternationalAbierto (Texto Completo)http://creativecommons.org/licenses/by-sa/4.0/http://purl.org/coar/access_right/c_abf2Banco Mundial. (2017, mayo 17). Graduarse: Solo la mitad lo logra en América Latina. World Bank. https://www.bancomundial.org/es/news/feature/2017/05/17/graduating-only-half-of-latin-american-students-manage-to-do-soChapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS inc, 9(13).Gaurav. (2021, junio 12). An Introduction to Gradient Boosting Decision Trees. Machine Learning Plus. https://www.machinelearningplus.com/machine-learning/an-introduction-to-gradient-boosting-decision-trees/Han, J. (2006). Data Mining: Concepts and Techniques. Elsevier.Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación McGraw-Hill.Kohavi, R., Rothleder, N. J., & Simoudis, E. (2002). Emerging trends in business analytics. Communications of the ACM, 45(8).Patel, A. (2020, marzo 18). Stacking -Ensemble meta Algorithms for improve predictions. ML Research Lab. https://medium.com/ml-research-lab/stacking-ensemble-meta-algorithms-for-improve-predictions-f4b4cf3b9237¿Qué es KNN? | IBM. (s. f.). ¿Qué es KNN? | IBM. Recuperado 25 de octubre de 2023, de https://www.ibm.com/mx-es/topics/knnRidge Regression Explained, Step by Step. (2021, mayo 23). Ridge Regression Explained, Step by Step. Machine Learning Compass.https://machinelearningcompass.com/machine_learning_models/ridge_regression/Team Dst, D. (2022, enero 25). Random Forest: Bosque aleatorio. Definición y funcionamiento. Formation Data Science | DataScientest.com. https://datascientest.com/es/random-forest-bosque-aleatorio-definicion-y-funcionamientoWilliamson, B. (2018). Big data en educación: El futuro digital del aprendizaje, la política y la práctica. Ediciones Morata.Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE transactions on knowledge and data engineering, 26(1).instname:Universidad del Rosarioreponame:Repositorio Institucional EdocURSaber 11Saber ProResultadosÁrea del conocimientoModelo analítico predictivoMetodología CRISP-DMSaber 11Saber ProResultsKnowledge areaPredictive analytical modelCRISP-DM methodologyDiseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superiorDesigning a predictive model for academic performance of students entering higher educationbachelorThesisTrabajo de gradoTrabajo de gradohttp://purl.org/coar/resource_type/c_7a1fEscuela de Ingeniería, Ciencia y TecnologíaLICENSElicense.txtlicense.txttext/plain1483https://repository.urosario.edu.co/bitstreams/4f2a0adf-6736-46e9-b1a6-fa1b05e14354/downloadb2825df9f458e9d5d96ee8b7cd74fde6MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81154https://repository.urosario.edu.co/bitstreams/2fea00ac-afcf-448c-9dce-72f88f566e71/downloadadb7af3ef071a784ffe1b544b9a344abMD55ORIGINALDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdfDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdfapplication/pdf2639203https://repository.urosario.edu.co/bitstreams/6be0dce3-39da-418c-9c0a-273a3a4db311/download4a9d1c2ce6331569609099c7e9a212e6MD56Diseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-1-2024.zipDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-1-2024.zip application/zip27434622https://repository.urosario.edu.co/bitstreams/ee31dc86-fb2c-4e7d-bfae-5ca0a95d17a8/download78e801b191097c630525b795f4fa42e3MD57TEXTDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.txtDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.txtExtracted texttext/plain101679https://repository.urosario.edu.co/bitstreams/c1983d89-d449-4916-90f1-9f6c0a1ff4cf/downloada6adbd8ea203eb56e212bc0d0f950af8MD58THUMBNAILDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.jpgDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.jpgGenerated Thumbnailimage/jpeg2288https://repository.urosario.edu.co/bitstreams/db079620-4a8e-4af1-b685-58b7ed3b002a/downloadacd443028ab29a4982f879f49f196636MD5910336/42433oai:repository.urosario.edu.co:10336/424332024-04-13 03:00:36.463http://creativecommons.org/licenses/by-sa/4.0/Attribution-ShareAlike 4.0 Internationalhttps://repository.urosario.edu.coRepositorio institucional EdocURedocur@urosario.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8gbGEgb2JyYSBlcyBkZSBleGNsdXNpdmEgYXV0b3LDrWEgeSB0aWVuZSBsYSB0aXR1bGFyaWRhZCBzb2JyZSBsYSBtaXNtYS4KPGJyLz4KUEFSQUdSQUZPOiBFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgRUwgQVVUT1IsIGFzdW1pcsOhIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkLCB5IHNhbGRyw6EgZW4gZGVmZW5zYSBkZSBsb3MgZGVyZWNob3MgYXF1w60gYXV0b3JpemFkb3M7IHBhcmEgdG9kb3MgbG9zIGVmZWN0b3MgbGEgdW5pdmVyc2lkYWQgYWN0w7phIGNvbW8gdW4gdGVyY2VybyBkZSBidWVuYSBmZS4KPGhyLz4KRUwgQVVUT1IsIGF1dG9yaXphIGEgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8sICBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBhbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCAgdXRpbGljZSB5IHVzZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuLgoKLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KClBPTElUSUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuIERlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcyBwb3IgcGFydGUgZGUgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8gIHBhcmEgZmluZXMgYWNhZMOpbWljb3MgeSBlbiBhcGxpY2FjacOzbiBkZSBjb252ZW5pb3MgY29uIHRlcmNlcm9zIG8gc2VydmljaW9zIGNvbmV4b3MgY29uIGFjdGl2aWRhZGVzIHByb3BpYXMgZGUgbGEgYWNhZGVtaWEsIGNvbiBlc3RyaWN0byBjdW1wbGltaWVudG8gZGUgbG9zIHByaW5jaXBpb3MgZGUgbGV5LiBQYXJhIGVsIGNvcnJlY3RvIGVqZXJjaWNpbyBkZSBtaSBkZXJlY2hvIGRlIGhhYmVhcyBkYXRhICBjdWVudG8gY29uIGxhIGN1ZW50YSBkZSBjb3JyZW8gaGFiZWFzZGF0YUB1cm9zYXJpby5lZHUuY28sIGRvbmRlIHByZXZpYSBpZGVudGlmaWNhY2nDs24gIHBvZHLDqSBzb2xpY2l0YXIgbGEgY29uc3VsdGEsIGNvcnJlY2Npw7NuIHkgc3VwcmVzacOzbiBkZSBtaXMgZGF0b3MuCg==