Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior
Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de...
- Autores:
- Tipo de recurso:
- Fecha de publicación:
- 2024
- Institución:
- Universidad del Rosario
- Repositorio:
- Repositorio EdocUR - U. Rosario
- Idioma:
- spa
- OAI Identifier:
- oai:repository.urosario.edu.co:10336/42433
- Acceso en línea:
- https://repository.urosario.edu.co/handle/10336/42433
- Palabra clave:
- Saber 11
Saber Pro
Resultados
Área del conocimiento
Modelo analítico predictivo
Metodología CRISP-DM
Saber 11
Saber Pro
Results
Knowledge area
Predictive analytical model
CRISP-DM methodology
- Rights
- License
- Attribution-ShareAlike 4.0 International
id |
EDOCUR2_d40eb05a70730e016a7c6488724eb921 |
---|---|
oai_identifier_str |
oai:repository.urosario.edu.co:10336/42433 |
network_acronym_str |
EDOCUR2 |
network_name_str |
Repositorio EdocUR - U. Rosario |
repository_id_str |
|
dc.title.none.fl_str_mv |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
dc.title.TranslatedTitle.none.fl_str_mv |
Designing a predictive model for academic performance of students entering higher education |
title |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
spellingShingle |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior Saber 11 Saber Pro Resultados Área del conocimiento Modelo analítico predictivo Metodología CRISP-DM Saber 11 Saber Pro Results Knowledge area Predictive analytical model CRISP-DM methodology |
title_short |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
title_full |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
title_fullStr |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
title_full_unstemmed |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
title_sort |
Diseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superior |
dc.contributor.advisor.none.fl_str_mv |
Calvo López, John Pablo |
dc.subject.none.fl_str_mv |
Saber 11 Saber Pro Resultados Área del conocimiento Modelo analítico predictivo Metodología CRISP-DM |
topic |
Saber 11 Saber Pro Resultados Área del conocimiento Modelo analítico predictivo Metodología CRISP-DM Saber 11 Saber Pro Results Knowledge area Predictive analytical model CRISP-DM methodology |
dc.subject.keyword.none.fl_str_mv |
Saber 11 Saber Pro Results Knowledge area Predictive analytical model CRISP-DM methodology |
description |
Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de la Salud, Ciencias Sociales y Humanas, Economía, Administración, Contaduría, Ingeniería, Arquitectura, Urbanismo, Matemáticas y Ciencias Naturales. Estos modelos tienen como objetivo identificar y jerarquizar las áreas de estudio con mayor influencia en el rendimiento en las pruebas, proporcionando orientación para la toma de decisiones relacionadas con el ingreso a la educación superior. Los modelos se basan en los resultados obtenidos en las pruebas Saber 11 y Saber Pro en Colombia, que evalúan las competencias generales y específicas de los estudiantes de bachillerato y universitarios. Se centran en la identificación de variables socioeconómicas, educativas y de desempeño académico relevantes para anticipar el éxito de los estudiantes en la educación superior. El desarrollo de estos modelos predictivos seguirá la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), que consta de seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. La aplicación de esta metodología garantizará un análisis de los datos de las pruebas Saber, asegurando la calidad del modelo predictivo y evaluando su efectividad mediante indicadores de precisión. En última instancia, el modelo propuesto brindará a los estudiantes que cuenten con resultados de la prueba Saber 11 una estimación del puntaje de desempeño en las pruebas Saber Pro para cada área del conocimiento en la educación superior. Este enfoque permitirá que los estudiantes tomen decisiones informadas y basadas en datos al seleccionar su área de estudio, lo que optimizará sus posibilidades de éxito en la educación superior. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-04-12T13:49:28Z |
dc.date.available.none.fl_str_mv |
2024-04-12T13:49:28Z |
dc.date.created.none.fl_str_mv |
2024-03-21 |
dc.type.none.fl_str_mv |
bachelorThesis |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.document.none.fl_str_mv |
Trabajo de grado |
dc.type.spa.none.fl_str_mv |
Trabajo de grado |
dc.identifier.uri.none.fl_str_mv |
https://repository.urosario.edu.co/handle/10336/42433 |
url |
https://repository.urosario.edu.co/handle/10336/42433 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.*.fl_str_mv |
Attribution-ShareAlike 4.0 International |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.acceso.none.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-sa/4.0/ |
rights_invalid_str_mv |
Attribution-ShareAlike 4.0 International Abierto (Texto Completo) http://creativecommons.org/licenses/by-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.none.fl_str_mv |
94 pp |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad del Rosario |
dc.publisher.department.none.fl_str_mv |
Escuela de Administración Escuela de Ingeniería, Ciencia y Tecnología |
dc.publisher.program.none.fl_str_mv |
Maestría en Business Analytics |
publisher.none.fl_str_mv |
Universidad del Rosario |
institution |
Universidad del Rosario |
dc.source.bibliographicCitation.none.fl_str_mv |
Banco Mundial. (2017, mayo 17). Graduarse: Solo la mitad lo logra en América Latina. World Bank. https://www.bancomundial.org/es/news/feature/2017/05/17/graduating-only-half-of-latin-american-students-manage-to-do-so Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS inc, 9(13). Gaurav. (2021, junio 12). An Introduction to Gradient Boosting Decision Trees. Machine Learning Plus. https://www.machinelearningplus.com/machine-learning/an-introduction-to-gradient-boosting-decision-trees/ Han, J. (2006). Data Mining: Concepts and Techniques. Elsevier. Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación McGraw-Hill. Kohavi, R., Rothleder, N. J., & Simoudis, E. (2002). Emerging trends in business analytics. Communications of the ACM, 45(8). Patel, A. (2020, marzo 18). Stacking -Ensemble meta Algorithms for improve predictions. ML Research Lab. https://medium.com/ml-research-lab/stacking-ensemble-meta-algorithms-for-improve-predictions-f4b4cf3b9237 ¿Qué es KNN? | IBM. (s. f.). ¿Qué es KNN? | IBM. Recuperado 25 de octubre de 2023, de https://www.ibm.com/mx-es/topics/knn Ridge Regression Explained, Step by Step. (2021, mayo 23). Ridge Regression Explained, Step by Step. Machine Learning Compass. https://machinelearningcompass.com/machine_learning_models/ridge_regression/ Team Dst, D. (2022, enero 25). Random Forest: Bosque aleatorio. Definición y funcionamiento. Formation Data Science | DataScientest.com. https://datascientest.com/es/random-forest-bosque-aleatorio-definicion-y-funcionamiento Williamson, B. (2018). Big data en educación: El futuro digital del aprendizaje, la política y la práctica. Ediciones Morata. Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE transactions on knowledge and data engineering, 26(1). |
dc.source.instname.none.fl_str_mv |
instname:Universidad del Rosario |
dc.source.reponame.none.fl_str_mv |
reponame:Repositorio Institucional EdocUR |
bitstream.url.fl_str_mv |
https://repository.urosario.edu.co/bitstreams/4f2a0adf-6736-46e9-b1a6-fa1b05e14354/download https://repository.urosario.edu.co/bitstreams/2fea00ac-afcf-448c-9dce-72f88f566e71/download https://repository.urosario.edu.co/bitstreams/6be0dce3-39da-418c-9c0a-273a3a4db311/download https://repository.urosario.edu.co/bitstreams/ee31dc86-fb2c-4e7d-bfae-5ca0a95d17a8/download https://repository.urosario.edu.co/bitstreams/c1983d89-d449-4916-90f1-9f6c0a1ff4cf/download https://repository.urosario.edu.co/bitstreams/db079620-4a8e-4af1-b685-58b7ed3b002a/download |
bitstream.checksum.fl_str_mv |
b2825df9f458e9d5d96ee8b7cd74fde6 adb7af3ef071a784ffe1b544b9a344ab 4a9d1c2ce6331569609099c7e9a212e6 78e801b191097c630525b795f4fa42e3 a6adbd8ea203eb56e212bc0d0f950af8 acd443028ab29a4982f879f49f196636 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional EdocUR |
repository.mail.fl_str_mv |
edocur@urosario.edu.co |
_version_ |
1814167450174881792 |
spelling |
Calvo López, John Pablo0bf1638c-a12e-4cf9-876a-ce604568a9ef-1Soto Dueñas, José LuisAcevedo Tarazona, Sindy YulianaMagíster en Business AnalyticsFull time8e9cdea3-594b-4d5a-aac8-e8391de5b98f-126eb78eb-b14e-4640-ad57-39f86e284d22-12024-04-12T13:49:28Z2024-04-12T13:49:28Z2024-03-21Este proyecto se enfoca en el desarrollo de modelos predictivos para evaluar el desempeño de los estudiantes en las pruebas Saber Pro, con énfasis en áreas específicas del conocimiento en la educación superior, que incluyen Agronomía, Veterinaria, Bellas Artes, Ciencias de la Educación, Ciencias de la Salud, Ciencias Sociales y Humanas, Economía, Administración, Contaduría, Ingeniería, Arquitectura, Urbanismo, Matemáticas y Ciencias Naturales. Estos modelos tienen como objetivo identificar y jerarquizar las áreas de estudio con mayor influencia en el rendimiento en las pruebas, proporcionando orientación para la toma de decisiones relacionadas con el ingreso a la educación superior. Los modelos se basan en los resultados obtenidos en las pruebas Saber 11 y Saber Pro en Colombia, que evalúan las competencias generales y específicas de los estudiantes de bachillerato y universitarios. Se centran en la identificación de variables socioeconómicas, educativas y de desempeño académico relevantes para anticipar el éxito de los estudiantes en la educación superior. El desarrollo de estos modelos predictivos seguirá la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), que consta de seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. La aplicación de esta metodología garantizará un análisis de los datos de las pruebas Saber, asegurando la calidad del modelo predictivo y evaluando su efectividad mediante indicadores de precisión. En última instancia, el modelo propuesto brindará a los estudiantes que cuenten con resultados de la prueba Saber 11 una estimación del puntaje de desempeño en las pruebas Saber Pro para cada área del conocimiento en la educación superior. Este enfoque permitirá que los estudiantes tomen decisiones informadas y basadas en datos al seleccionar su área de estudio, lo que optimizará sus posibilidades de éxito en la educación superior.This project focuses on the development of predictive models to assess the performance of students in the Saber Pro tests, with an emphasis on specific knowledge areas in higher education, including Agronomy, Veterinary Sciences, Fine Arts, Education Sciences, Health Sciences, Social and Human Sciences, Economics, Management, Accounting, Engineering, Architecture, Urbanism, Mathematics, and Natural Sciences. These models aim to identify and prioritize the areas of study that have the most significant influence on performance in the tests, providing guidance for decisions related to entering higher education. The models are based on the results obtained in the Saber 11 and Saber Pro tests in Colombia, which evaluate the general and specific competencies of high school and university students. They focus on identifying socio-economic, educational, and academic performance variables that are relevant in predicting students' success in higher education. The development of these predictive models will follow the CRISP-DM methodology (Cross-Industry Standard Process for Data Mining), which comprises six phases: understanding the problem, understanding the data, data preparation, modeling, evaluation, and deployment. The application of this methodology will ensure a rigorous analysis of the Saber test data, ensuring the quality of the predictive model and evaluating its effectiveness through precision indicators. Ultimately, the proposed model will provide students with Saber 11 results with an estimation of their performance score in the Saber Pro tests for each knowledge area in higher education. This approach will enable students to make informed, data-driven decisions when selecting their field of study, thereby optimizing their chances of success in higher education.94 ppapplication/pdfhttps://repository.urosario.edu.co/handle/10336/42433spaUniversidad del RosarioEscuela de AdministraciónEscuela de Ingeniería, Ciencia y TecnologíaMaestría en Business AnalyticsAttribution-ShareAlike 4.0 InternationalAbierto (Texto Completo)http://creativecommons.org/licenses/by-sa/4.0/http://purl.org/coar/access_right/c_abf2Banco Mundial. (2017, mayo 17). Graduarse: Solo la mitad lo logra en América Latina. World Bank. https://www.bancomundial.org/es/news/feature/2017/05/17/graduating-only-half-of-latin-american-students-manage-to-do-soChapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS inc, 9(13).Gaurav. (2021, junio 12). An Introduction to Gradient Boosting Decision Trees. Machine Learning Plus. https://www.machinelearningplus.com/machine-learning/an-introduction-to-gradient-boosting-decision-trees/Han, J. (2006). Data Mining: Concepts and Techniques. Elsevier.Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación McGraw-Hill.Kohavi, R., Rothleder, N. J., & Simoudis, E. (2002). Emerging trends in business analytics. Communications of the ACM, 45(8).Patel, A. (2020, marzo 18). Stacking -Ensemble meta Algorithms for improve predictions. ML Research Lab. https://medium.com/ml-research-lab/stacking-ensemble-meta-algorithms-for-improve-predictions-f4b4cf3b9237¿Qué es KNN? | IBM. (s. f.). ¿Qué es KNN? | IBM. Recuperado 25 de octubre de 2023, de https://www.ibm.com/mx-es/topics/knnRidge Regression Explained, Step by Step. (2021, mayo 23). Ridge Regression Explained, Step by Step. Machine Learning Compass.https://machinelearningcompass.com/machine_learning_models/ridge_regression/Team Dst, D. (2022, enero 25). Random Forest: Bosque aleatorio. Definición y funcionamiento. Formation Data Science | DataScientest.com. https://datascientest.com/es/random-forest-bosque-aleatorio-definicion-y-funcionamientoWilliamson, B. (2018). Big data en educación: El futuro digital del aprendizaje, la política y la práctica. Ediciones Morata.Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE transactions on knowledge and data engineering, 26(1).instname:Universidad del Rosarioreponame:Repositorio Institucional EdocURSaber 11Saber ProResultadosÁrea del conocimientoModelo analítico predictivoMetodología CRISP-DMSaber 11Saber ProResultsKnowledge areaPredictive analytical modelCRISP-DM methodologyDiseño de un modelo predictivo del desempeño académico de estudiantes que ingresen a la educación superiorDesigning a predictive model for academic performance of students entering higher educationbachelorThesisTrabajo de gradoTrabajo de gradohttp://purl.org/coar/resource_type/c_7a1fEscuela de Ingeniería, Ciencia y TecnologíaLICENSElicense.txtlicense.txttext/plain1483https://repository.urosario.edu.co/bitstreams/4f2a0adf-6736-46e9-b1a6-fa1b05e14354/downloadb2825df9f458e9d5d96ee8b7cd74fde6MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81154https://repository.urosario.edu.co/bitstreams/2fea00ac-afcf-448c-9dce-72f88f566e71/downloadadb7af3ef071a784ffe1b544b9a344abMD55ORIGINALDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdfDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdfapplication/pdf2639203https://repository.urosario.edu.co/bitstreams/6be0dce3-39da-418c-9c0a-273a3a4db311/download4a9d1c2ce6331569609099c7e9a212e6MD56Diseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-1-2024.zipDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-1-2024.zip application/zip27434622https://repository.urosario.edu.co/bitstreams/ee31dc86-fb2c-4e7d-bfae-5ca0a95d17a8/download78e801b191097c630525b795f4fa42e3MD57TEXTDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.txtDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.txtExtracted texttext/plain101679https://repository.urosario.edu.co/bitstreams/c1983d89-d449-4916-90f1-9f6c0a1ff4cf/downloada6adbd8ea203eb56e212bc0d0f950af8MD58THUMBNAILDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.jpgDiseno_de_un_modelo_predictivo_del_desempeno_academico_SotoDuenas-JoseLuis-2024.pdf.jpgGenerated Thumbnailimage/jpeg2288https://repository.urosario.edu.co/bitstreams/db079620-4a8e-4af1-b685-58b7ed3b002a/downloadacd443028ab29a4982f879f49f196636MD5910336/42433oai:repository.urosario.edu.co:10336/424332024-04-13 03:00:36.463http://creativecommons.org/licenses/by-sa/4.0/Attribution-ShareAlike 4.0 Internationalhttps://repository.urosario.edu.coRepositorio institucional EdocURedocur@urosario.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8gbGEgb2JyYSBlcyBkZSBleGNsdXNpdmEgYXV0b3LDrWEgeSB0aWVuZSBsYSB0aXR1bGFyaWRhZCBzb2JyZSBsYSBtaXNtYS4KPGJyLz4KUEFSQUdSQUZPOiBFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgRUwgQVVUT1IsIGFzdW1pcsOhIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkLCB5IHNhbGRyw6EgZW4gZGVmZW5zYSBkZSBsb3MgZGVyZWNob3MgYXF1w60gYXV0b3JpemFkb3M7IHBhcmEgdG9kb3MgbG9zIGVmZWN0b3MgbGEgdW5pdmVyc2lkYWQgYWN0w7phIGNvbW8gdW4gdGVyY2VybyBkZSBidWVuYSBmZS4KPGhyLz4KRUwgQVVUT1IsIGF1dG9yaXphIGEgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8sICBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBhbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCAgdXRpbGljZSB5IHVzZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuLgoKLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KClBPTElUSUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuIERlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcyBwb3IgcGFydGUgZGUgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8gIHBhcmEgZmluZXMgYWNhZMOpbWljb3MgeSBlbiBhcGxpY2FjacOzbiBkZSBjb252ZW5pb3MgY29uIHRlcmNlcm9zIG8gc2VydmljaW9zIGNvbmV4b3MgY29uIGFjdGl2aWRhZGVzIHByb3BpYXMgZGUgbGEgYWNhZGVtaWEsIGNvbiBlc3RyaWN0byBjdW1wbGltaWVudG8gZGUgbG9zIHByaW5jaXBpb3MgZGUgbGV5LiBQYXJhIGVsIGNvcnJlY3RvIGVqZXJjaWNpbyBkZSBtaSBkZXJlY2hvIGRlIGhhYmVhcyBkYXRhICBjdWVudG8gY29uIGxhIGN1ZW50YSBkZSBjb3JyZW8gaGFiZWFzZGF0YUB1cm9zYXJpby5lZHUuY28sIGRvbmRlIHByZXZpYSBpZGVudGlmaWNhY2nDs24gIHBvZHLDqSBzb2xpY2l0YXIgbGEgY29uc3VsdGEsIGNvcnJlY2Npw7NuIHkgc3VwcmVzacOzbiBkZSBtaXMgZGF0b3MuCg== |