Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia

Para prevenir la alta repitencia en materias críticas, las instituciones educativas suelen desarrollar estrategias para apoyar a sus educandos, sin embargo, estas históricamente se desarrollan desde una perspectiva reactiva (no predictiva), por lo que no suelen dar los resultados esperados. De igual...

Full description

Autores:
Granadillo Díaz, Carlos Daniel
Llinás Marimón, Brian Jesús
López Ramos, Simón Eduardo
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/10497
Acceso en línea:
http://hdl.handle.net/10584/10497
Palabra clave:
Resiliencia
Machine Learning
Rendimiento académico
Clasificación
Árbol de decisión
Bosque aleatorio
XGBoost
Resilience
Machine Learning
Academic performance
Classification
Decision Trees
Random forest
XGBoost
Rights
License
Universidad del Norte
id REPOUNORT2_d46e4c89b9715eef4088e2dcaedd1947
oai_identifier_str oai:manglar.uninorte.edu.co:10584/10497
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
dc.title.en_US.fl_str_mv Design of a machine learning model for predicting academic performance based on resilience
title Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
spellingShingle Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
Resiliencia
Machine Learning
Rendimiento académico
Clasificación
Árbol de decisión
Bosque aleatorio
XGBoost
Resilience
Machine Learning
Academic performance
Classification
Decision Trees
Random forest
XGBoost
title_short Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
title_full Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
title_fullStr Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
title_full_unstemmed Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
title_sort Diseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resiliencia
dc.creator.fl_str_mv Granadillo Díaz, Carlos Daniel
Llinás Marimón, Brian Jesús
López Ramos, Simón Eduardo
dc.contributor.advisor.none.fl_str_mv Peñabaena Niebles, Rita
Romero Rodríguez, Daniel
dc.contributor.author.none.fl_str_mv Granadillo Díaz, Carlos Daniel
Llinás Marimón, Brian Jesús
López Ramos, Simón Eduardo
dc.subject.es_ES.fl_str_mv Resiliencia
Machine Learning
Rendimiento académico
Clasificación
Árbol de decisión
Bosque aleatorio
XGBoost
topic Resiliencia
Machine Learning
Rendimiento académico
Clasificación
Árbol de decisión
Bosque aleatorio
XGBoost
Resilience
Machine Learning
Academic performance
Classification
Decision Trees
Random forest
XGBoost
dc.subject.en_US.fl_str_mv Resilience
Machine Learning
Academic performance
Classification
Decision Trees
Random forest
XGBoost
description Para prevenir la alta repitencia en materias críticas, las instituciones educativas suelen desarrollar estrategias para apoyar a sus educandos, sin embargo, estas históricamente se desarrollan desde una perspectiva reactiva (no predictiva), por lo que no suelen dar los resultados esperados. De igual forma, dichas instituciones han pretendido identificar a la población que necesita su apoyo a través de metodologías que implican el análisis de información netamente académica, dejando de lado factores de la personalidad, como la resiliencia del estudiante. Para mejorar entonces la forma en que las universidades identifican la población que tendrá un bajo rendimiento se propone un modelo de aprendizaje automático (Machine Learning) de rendimiento académico teniendo en consideración como variable predictora la resiliencia. El diseño del modelo consta de dos grandes etapas: el computo cuantitativo de la resiliencia, y la estimación del modelo predictivo. Para la primera, se estimó una evaluación cuantitativa de la resiliencia haciendo uso de un algoritmo de reglas de decisión, y para la etapa de clasificación se diseñaron tres modelos: “Decision Tree”, “Random Forest”, y “XGBoostrap”. A todos se les evaluaron unas métricas de desempeño, en este caso el Accuracy y el AUC, para poder comparar la capacidad predictiva de las alternativas, y finalmente seleccionar el mejor modelo. Se encontró que el algoritmo de “eXtreme Gradient Boosted trees” (XGBoost) es confiable y con una robusta capacidad de predicción. Por último, los resultados obtenidos muestran que la resiliencia aporta en la predicción de rendimiento académico, sin embargo, existen variables con mayor poder explicativo, como el tipo de metodología de evaluación que se utilice en el semestre en el que se dará la asignatura.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-06-03T20:08:55Z
dc.date.available.none.fl_str_mv 2022-06-03T20:08:55Z
dc.date.issued.none.fl_str_mv 2022-05-30
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/10497
url http://hdl.handle.net/10584/10497
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2022
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/10497/1/Foto%20proyecto%20Espa%c3%b1ol.jpg
https://manglar.uninorte.edu.co/bitstream/10584/10497/2/Foto%20proyecto%20Espa%c3%b1ol.pdf
https://manglar.uninorte.edu.co/bitstream/10584/10497/3/Foto%20proyecto%20English.jpg
https://manglar.uninorte.edu.co/bitstream/10584/10497/4/Foto%20proyecto%20English.pdf
https://manglar.uninorte.edu.co/bitstream/10584/10497/5/license.txt
bitstream.checksum.fl_str_mv 99203eb1e3d2ffb23c629c30de27341b
22421551d31eaf26cb3c491457239076
f259e83478d31b7ba177ccb0cf35d0f4
7bf76b4cc3875ae2d92ea33f2b0c2b40
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1818112692475396096
spelling Peñabaena Niebles, RitaRomero Rodríguez, DanielGranadillo Díaz, Carlos DanielLlinás Marimón, Brian JesúsLópez Ramos, Simón Eduardo2022-06-03T20:08:55Z2022-06-03T20:08:55Z2022-05-30http://hdl.handle.net/10584/10497Para prevenir la alta repitencia en materias críticas, las instituciones educativas suelen desarrollar estrategias para apoyar a sus educandos, sin embargo, estas históricamente se desarrollan desde una perspectiva reactiva (no predictiva), por lo que no suelen dar los resultados esperados. De igual forma, dichas instituciones han pretendido identificar a la población que necesita su apoyo a través de metodologías que implican el análisis de información netamente académica, dejando de lado factores de la personalidad, como la resiliencia del estudiante. Para mejorar entonces la forma en que las universidades identifican la población que tendrá un bajo rendimiento se propone un modelo de aprendizaje automático (Machine Learning) de rendimiento académico teniendo en consideración como variable predictora la resiliencia. El diseño del modelo consta de dos grandes etapas: el computo cuantitativo de la resiliencia, y la estimación del modelo predictivo. Para la primera, se estimó una evaluación cuantitativa de la resiliencia haciendo uso de un algoritmo de reglas de decisión, y para la etapa de clasificación se diseñaron tres modelos: “Decision Tree”, “Random Forest”, y “XGBoostrap”. A todos se les evaluaron unas métricas de desempeño, en este caso el Accuracy y el AUC, para poder comparar la capacidad predictiva de las alternativas, y finalmente seleccionar el mejor modelo. Se encontró que el algoritmo de “eXtreme Gradient Boosted trees” (XGBoost) es confiable y con una robusta capacidad de predicción. Por último, los resultados obtenidos muestran que la resiliencia aporta en la predicción de rendimiento académico, sin embargo, existen variables con mayor poder explicativo, como el tipo de metodología de evaluación que se utilice en el semestre en el que se dará la asignatura.Educational institutions usually develop strategies to support their students to prevent high repetition rates in critical subjects; however, these strategies have historically been developed from a reactive (not predictive) perspective. Therefore, they do not usually retrieve the expected results. Furthermore, these institutions have tried to identify the population that needs their support through methodologies that involve the analysis of just academic information, leaving aside personality factors, such as student resilience. To improve how universities identify the population that will have a low performance, a Machine Learning model of academic performance is proposed, taking into consideration resilience as a predictor variable. The design of the model consists of two main stages: the quantitative computation of resilience, and the estimation of the predictive model. For the first, a quantitative assessment of resilience was estimated using a decision rule algorithm, and for the classification stage, three models were designed: "Decision Tree", "Random Forest", and "XGBoostrap". All of them were evaluated on performance metrics, in this case, the accuracy and the AUC, to compare the predictive capacity of the alternatives, and finally select the best model. The "eXtreme Gradient Boosted Trees" (XGBoost) algorithm was found to be reliable and with a robust predictive capability. Finally, the results obtained show that resilience contributes to the prediction of academic performance; however, there are variables with greater explanatory power, such as the type of evaluation methodology used in the semester in which the subject will be given.spaBarranquilla, Universidad del Norte, 2022Universidad del Nortehttp://purl.org/coar/access_right/c_abf2ResilienciaMachine LearningRendimiento académicoClasificaciónÁrbol de decisiónBosque aleatorioXGBoostResilienceMachine LearningAcademic performanceClassificationDecision TreesRandom forestXGBoostDiseño de un modelo de machine learning para predicción de rendimiento académico a partir de la resilienciaDesign of a machine learning model for predicting academic performance based on resiliencearticlehttp://purl.org/coar/resource_type/c_6501ORIGINALFoto proyecto Español.jpgFoto proyecto Español.jpgModelo machine learning a partir de la resilienciaimage/jpeg558100https://manglar.uninorte.edu.co/bitstream/10584/10497/1/Foto%20proyecto%20Espa%c3%b1ol.jpg99203eb1e3d2ffb23c629c30de27341bMD51Foto proyecto Español.pdfFoto proyecto Español.pdfModelo machine learning a partir de la resilienciaapplication/pdf532737https://manglar.uninorte.edu.co/bitstream/10584/10497/2/Foto%20proyecto%20Espa%c3%b1ol.pdf22421551d31eaf26cb3c491457239076MD52Foto proyecto English.jpgFoto proyecto English.jpgMachine learning model based on resilienceimage/jpeg541531https://manglar.uninorte.edu.co/bitstream/10584/10497/3/Foto%20proyecto%20English.jpgf259e83478d31b7ba177ccb0cf35d0f4MD53Foto proyecto English.pdfFoto proyecto English.pdfMachine learning model based on resilienceapplication/pdf76469https://manglar.uninorte.edu.co/bitstream/10584/10497/4/Foto%20proyecto%20English.pdf7bf76b4cc3875ae2d92ea33f2b0c2b40MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/10497/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5510584/10497oai:manglar.uninorte.edu.co:10584/104972022-06-03 15:08:56.14Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=