Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning

En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpi...

Full description

Autores:
Galvis Martínez, Miguel Ángel
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad Cooperativa de Colombia
Repositorio:
Repositorio UCC
Idioma:
spa
OAI Identifier:
oai:repository.ucc.edu.co:20.500.12494/56199
Acceso en línea:
https://hdl.handle.net/20.500.12494/56199
Palabra clave:
000 - Ciencias de la computación, información y obras generales
Deserción
Modelos computacionales
Minería de datos
Desertion
Computational models
Data mining
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
id COOPER2_12973df72cee18a82d2f5dc03f7dd6a4
oai_identifier_str oai:repository.ucc.edu.co:20.500.12494/56199
network_acronym_str COOPER2
network_name_str Repositorio UCC
repository_id_str
dc.title.spa.fl_str_mv Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
title Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
spellingShingle Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
000 - Ciencias de la computación, información y obras generales
Deserción
Modelos computacionales
Minería de datos
Desertion
Computational models
Data mining
title_short Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
title_full Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
title_fullStr Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
title_full_unstemmed Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
title_sort Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
dc.creator.fl_str_mv Galvis Martínez, Miguel Ángel
dc.contributor.advisor.none.fl_str_mv Nova Martínez, Manuel Arturo
Porras García, Yerson Ferney
dc.contributor.author.none.fl_str_mv Galvis Martínez, Miguel Ángel
dc.subject.ddc.none.fl_str_mv 000 - Ciencias de la computación, información y obras generales
topic 000 - Ciencias de la computación, información y obras generales
Deserción
Modelos computacionales
Minería de datos
Desertion
Computational models
Data mining
dc.subject.proposal.spa.fl_str_mv Deserción
Modelos computacionales
Minería de datos
dc.subject.proposal.none.fl_str_mv Desertion
Computational models
Data mining
description En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpieza y análisis exploratorio se adecuaron con el objetivo de entrenar modelos computacionales de Random Forest para determinar la probabilidad de que un estudiante abandone sus estudios académicos. En este documento en primer lugar se realiza una descripción sobre lo que es la deserción basada en datos y estudios nacionales como internacionales y se contextualiza la problemática en Colombia, posteriormente se explican los conceptos que se usaran en esta investigación tales como machine learning, data mining, modelos computacionales, métricas de evaluación, entre otros. Luego se detalla el procedimiento del trabajo que se realizó en la recolección de más de 800 registros de estudiantes por medio de una serie de encuestas realizadas en los periodos académicos 2023-10 y 2023-20, con más de 45 preguntas, donde se tomó una muestra de 483 estudiantes que pertenecen a la facultad de ingeniería la cual está conformada por ingeniería de sistemas e ingeniería civil. Estos 2 datasets fueron sometidos a un análisis descriptivo con el fin de unificarlos en uno solo, en donde se aplicaron métodos de limpieza y estadísticos para ordenar la información de forma óptima para el entrenamiento de los modelos. La parte final del trabajo se concentra en el entrenamiento de modelos computacionales basados en el Algoritmo Random Forest, el cual es implementado mediante el uso de la librería sklearn.ensemble.RandomForestClassifier de Python y la metodología de búsqueda amplia GridsearchCv mediante la librería sklearn.model_selection.GridSearchCV para optimización de parámetros. Bajo este dataset se determina una configuración óptima de parámetros que entrega un 46.4 % de la métrica de desempeño.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-04T19:59:36Z
dc.date.available.none.fl_str_mv 2024-07-04T19:59:36Z
dc.date.issued.none.fl_str_mv 2024-06-25
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.none.fl_str_mv Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12494/56199
identifier_str_mv Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199
url https://hdl.handle.net/20.500.12494/56199
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv [1] A. M. Mariano, A. B. De Magalhães Lelis Ferreira, M. R. Santos, M. L. Castilho, and A. C. F. L. C. Bastos, “Decision trees for predicting dropout in Engineering Course students in Brazil,” in Procedia Computer Science, Elsevier B.V., 2022, pp. 1113–1120. doi: 10.1016/j.procs.2022.11.285.
[2] María Camila Jiménez, “Abandono universitario tarea en la que Iberoamérica se sigue rajando.” Accessed: Apr. 17, 2024. [Online]. Available: https://periodico.unal.edu.co/articulos/abandono-universitario-tarea-en-la-que-iberoamerica-se-sigue-rajando
[3] A. Gonzalez-Nucamendi, J. Noguez, L. Neri, V. Robledo-Rella, and R. M. G. García-Castelán, “Predictive analytics study to determine undergraduate students at risk of dropout,” Front Educ (Lausanne), vol. 8, 2023, doi: 10.3389/feduc.2023.1244686.
[4] E. Ministerio, “Estadísticas de deserción estudiantil, permanencia y graduación en educación superior Universitario Tecnológico Técnico profesional,” 2017. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-
[5] E. Chinkes, “Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una facultad,” 2018.
[6] J. Mesarić and D. Šebalj, “Decision trees for predicting the academic success of students,” Croatian Operational Research Review, vol. 367, pp. 367–388, 2016, doi: 10.17535/crorr.2016.0025.
[7] Ministerio de Educación Nacional, “Ministerio de Educación Nacional Subdirección de Desarrollo Sectorial,” 2013. [Online]. Available: www.mineducacion.gov.co
[8] Caracol Radio, “Más de 39.000 estudiantes abandonaron la universidad en Colombia.” Accessed: Mar. 18, 2023. [Online]. Available: https://caracol.com.co/programa/2021/11/04/sanamente/1636049871_761122.html
[9] Sistema para la Prevención de la Deserción de la Educación Superior, “Estadísticas de Deserción - Sistemas información.” Accessed: Mar. 18, 2023. [Online]. Available: https://www.mineducacion.gov.co/sistemasinfo/spadies/Informacion-Institucional/357549:Estadisticas-de-Desercion
[10] E. Barreno-Vereau, “Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria,” Interfases, vol. 0, no. 005, p. 45, Feb. 2012, doi: 10.26439/Interfases2012.N005.149.
[11] D. Santín González, “Detección de alumnos de riesgo y medición de la eficiencia de centros escolares mediante redes neuronales,” 1999. [Online]. Available: http://www.ucm.es/BUCM/cee/doc/9902/9902.htmm
[12] H. Felizzola Jiménez, Y. Adriana, J. Arias, A. María, C. Pastrana, and F. Villa Pedroza, “Modelo de predicción para la deserción temprana en la facultad de Ingeniería de la Universidad de la Salle,” 2018.
[13] K. R. Vergaray, “Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,” Innovación y Software, vol. 2, no. 2, pp. 6–13, Sep. 2021, Accessed: Feb. 25, 2023. [Online]. Available: https://revistas.ulasalle.edu.pe/innosoft/article/view/40
[14] R. I. Castro López, “Aplicación de técnicas de Machine Learning para el estudio de deserción temprana y egreso oportuno en estudiantes de ingeniería de la facultad de ciencias físicas y matemáticas.” Accessed: Feb. 25, 2023. [Online]. Available: https://repositorio.uchile.cl/bitstream/handle/2250/178598/Aplicacion-de-tecnicas-de-Machine-Learning-para-el-estudio-de-desercion-temprana-y-egreso-oportuno-en-estudiantes-de-Ingenieria-de-la-Facultad-de-Ciencias%20Fisicas-y-Matematicas.pdf?sequence=1&isAllowed=y
[15] A. Jose and C. Garcia, “Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos,” pp. 1–121, 2020.
[16] H. Y. Ayala Yaguara, M. Valenzuela Sabogal, and A. Espinosa García, “Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca.” Accessed: Feb. 25, 2023. [Online]. Available: https://journal.universidadean.edu.co/index.php/Revistao/article/view/2676/2087
[17] V. De La Cruz, “Diseño de un modelo predictivo basado en Machine Learning para el control de la deserción de estudiantes en la Universidad Ricardo Palma,” 2019.
[18] M. L. Avila Pérez, “Modelo De Predicción De Deserción Estudiantil, Apoyado En Tecnologías De Data Mining, En Un Curso De Primera Matrícula De La Escuela ECBTI De La UNAD,” pp. 1–151, 2021.
[19] J. D. T. D. F. T. Diofanor Acevedo, “Análisis de la Deserción Estudiantil en el Programa Ingeniería de Alimentos de la Universidad de Cartagena durante el Periodo Académico 2009 - 2013,” Cartagena, 2015.
[20] Antonio Berlanga, “El camino desde la Inteligencia Artificial al Big Data.”
[21] “Minería de datos: Qué es y por qué es importante | SAS.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.sas.com/es_co/insights/analytics/data-mining.html
[22] D. S. G. César Pérez López, Minería de datos. Técnicas y herramientas, vol. 1. 2007.
[23] E. M. Rojas, “Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo,” 2020.
[24] “‘Machine Learning’: definición, tipos y aplicaciones prácticas - Iberdrola.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico
[25] Wiley, Fundamentals and Methods of Machine and Deep Learning, Algorithms, Tools, and Applications. 2022.
[26] Sandra Navarro, “KeepCoding Bootcamps.” Accessed: May 12, 2024. [Online]. Available: https://keepcoding.io/blog/que-es-gridsearchcv/
[27] “sklearn.model_selection.GridSearchCV — scikit-learn 1.4.2 documentation.” Accessed: May 19, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
[28] J. Carlos González Sánchez and M. Javier Peñaloza Pérez, “Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en machine learning.,” 2021.
[29] “Conceptos básicos de ayuda de CRISP-DM - Documentación de IBM.” Accessed: Feb. 08, 2024. [Online]. Available: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview
[30] IBM, “¿Qué es un bosque aleatorio? | IBM.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.ibm.com/mx-es/topics/random-forest
[31] “sklearn.ensemble.RandomForestClassifier — scikit-learn 1.4.2 documentation.” Accessed: May 18, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html
[32] L. G. Díaz Monroy and M. A. Morales Rivera, Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Facultrad de Ciencias, Departamento de Estadística, 2009.
[33] “Prueba de ji cuadrado de bondad de ajuste | Introducción a la estadística | JMP.” Accessed: May 04, 2024. [Online]. Available: https://www.jmp.com/es_co/statistics-knowledge-portal/chi-square-test/chi-square-goodness-of-fit-test.html
[34] “La matriz de confusión y sus métricas – Inteligencia Artificial –.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 89 p.
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, Villavicencio
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas
dc.publisher.faculty.none.fl_str_mv Ingenierías
dc.publisher.place.none.fl_str_mv Villavicencio
dc.publisher.branch.none.fl_str_mv Villavicencio
publisher.none.fl_str_mv Universidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, Villavicencio
institution Universidad Cooperativa de Colombia
bitstream.url.fl_str_mv https://repository.ucc.edu.co/bitstreams/e91d7000-5f77-4a88-873f-2b9b0d5aeb97/download
https://repository.ucc.edu.co/bitstreams/d8dfef58-98eb-4fe8-a290-4b8c675b97b1/download
https://repository.ucc.edu.co/bitstreams/bbefac87-21eb-4416-bc74-8283729f3721/download
https://repository.ucc.edu.co/bitstreams/f8a4ff56-103e-4bde-bb15-21aad6d89e65/download
https://repository.ucc.edu.co/bitstreams/4d968cae-a239-4f4a-8bd8-4d60be5ebe1a/download
https://repository.ucc.edu.co/bitstreams/54c01867-069d-4d21-84fa-d0737a5a5ca2/download
https://repository.ucc.edu.co/bitstreams/128d0d82-bc57-451c-be99-7c9ccb2dfa3f/download
https://repository.ucc.edu.co/bitstreams/e55ac4f0-c53e-4f42-b16c-baa9938d884d/download
bitstream.checksum.fl_str_mv 985b07be81e42e74311740ff9181781b
507a5da5578083e4c22db331d70d27ad
4460e5956bc1d1639be9ae6146a50347
3bce4f7ab09dfc588f126e1e36e98a45
d1212ade6f89d57728bc133cdb7d0eac
944f5016906a3ba7cf7854471b598314
44ddecca48406bceb2432bd9618efabe
540ee1824142dfed4163ee9121349109
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Cooperativa de Colombia
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1814246630557220864
spelling Nova Martínez, Manuel ArturoPorras García, Yerson FerneyGalvis Martínez, Miguel Ángel2024-07-04T19:59:36Z2024-07-04T19:59:36Z2024-06-25Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199https://hdl.handle.net/20.500.12494/56199En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpieza y análisis exploratorio se adecuaron con el objetivo de entrenar modelos computacionales de Random Forest para determinar la probabilidad de que un estudiante abandone sus estudios académicos. En este documento en primer lugar se realiza una descripción sobre lo que es la deserción basada en datos y estudios nacionales como internacionales y se contextualiza la problemática en Colombia, posteriormente se explican los conceptos que se usaran en esta investigación tales como machine learning, data mining, modelos computacionales, métricas de evaluación, entre otros. Luego se detalla el procedimiento del trabajo que se realizó en la recolección de más de 800 registros de estudiantes por medio de una serie de encuestas realizadas en los periodos académicos 2023-10 y 2023-20, con más de 45 preguntas, donde se tomó una muestra de 483 estudiantes que pertenecen a la facultad de ingeniería la cual está conformada por ingeniería de sistemas e ingeniería civil. Estos 2 datasets fueron sometidos a un análisis descriptivo con el fin de unificarlos en uno solo, en donde se aplicaron métodos de limpieza y estadísticos para ordenar la información de forma óptima para el entrenamiento de los modelos. La parte final del trabajo se concentra en el entrenamiento de modelos computacionales basados en el Algoritmo Random Forest, el cual es implementado mediante el uso de la librería sklearn.ensemble.RandomForestClassifier de Python y la metodología de búsqueda amplia GridsearchCv mediante la librería sklearn.model_selection.GridSearchCV para optimización de parámetros. Bajo este dataset se determina una configuración óptima de parámetros que entrega un 46.4 % de la métrica de desempeño.In this undergraduate work research, records of socioeconomic, personal and academic perception data were collected from active students of the engineering faculty of the Universidad Cooperativa de Colombia, Villavicencio headquarters, which through a process of cleaning and exploratory analysis were adapted with the objective of training Random Forest computational models to determine the probability of a student abandoning their academic studies. In this document, first of all, a description is made of what desertion is based on national and international data and studies and the problem in Colombia is contextualized. Later, the concepts that will be used in this research are explained, such as machine learning, data mining. , computational models, evaluation metrics, among others. Then the procedure of the work that was carried out in the collection of more than 800 student records is detailed through a series of surveys carried out in the 2023-10 and 2023-20 academic periods, with more than 45 questions, where a sample of 483 students who belong to the engineering faculty which is made up of systems engineering and civil engineering. These 2 datasets were subjected to a descriptive analysis in order to unify them into a single one, where cleaning and statistical methods were applied to organize the information optimally for training the models. The final part of the work focuses on the training of computational models based on the Random Forest Algorithm, which is implemented through the use of the sklearn.ensemble.RandomForestClassifier Python library and the broad search methodology GridsearchCv through the sklearn.model_selection library. .GridSearchCV for parameter optimization. Under this dataset, an optimal parameter configuration is determined that delivers 46.4% of the performance metric.I. Introducción -- II. Planteamiento del problema -- III. Objetivos -- IV. Justificación -- V. Antecedentes -- VI. Marco Teórico -- VII. Metodología -- VIII. Desarrollo del trabajo -- IX. Fase de recolección de datos. -- X. Fase de análisis y unificación de los 2 datasets (Estudio y compresión de los datos). -- XI. Fase de análisis, limpieza y ordenamiento de los datos. -- XII. Análisis exploratorio de datos y correlaciones -- XIII. Conclusiones -- XIV. Referencias -- XV. Anexo --Ingeniero de Sistemas89 p.application/pdfspaUniversidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, VillavicencioIngeniería de SistemasIngenieríasVillavicencioVillavicenciohttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2000 - Ciencias de la computación, información y obras generalesDeserciónModelos computacionalesMinería de datosDesertionComputational modelsData miningModelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine LearningTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttp://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/acceptedVersion[1] A. M. Mariano, A. B. De Magalhães Lelis Ferreira, M. R. Santos, M. L. Castilho, and A. C. F. L. C. Bastos, “Decision trees for predicting dropout in Engineering Course students in Brazil,” in Procedia Computer Science, Elsevier B.V., 2022, pp. 1113–1120. doi: 10.1016/j.procs.2022.11.285.[2] María Camila Jiménez, “Abandono universitario tarea en la que Iberoamérica se sigue rajando.” Accessed: Apr. 17, 2024. [Online]. Available: https://periodico.unal.edu.co/articulos/abandono-universitario-tarea-en-la-que-iberoamerica-se-sigue-rajando[3] A. Gonzalez-Nucamendi, J. Noguez, L. Neri, V. Robledo-Rella, and R. M. G. García-Castelán, “Predictive analytics study to determine undergraduate students at risk of dropout,” Front Educ (Lausanne), vol. 8, 2023, doi: 10.3389/feduc.2023.1244686.[4] E. Ministerio, “Estadísticas de deserción estudiantil, permanencia y graduación en educación superior Universitario Tecnológico Técnico profesional,” 2017. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-[5] E. Chinkes, “Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una facultad,” 2018.[6] J. Mesarić and D. Šebalj, “Decision trees for predicting the academic success of students,” Croatian Operational Research Review, vol. 367, pp. 367–388, 2016, doi: 10.17535/crorr.2016.0025.[7] Ministerio de Educación Nacional, “Ministerio de Educación Nacional Subdirección de Desarrollo Sectorial,” 2013. [Online]. Available: www.mineducacion.gov.co[8] Caracol Radio, “Más de 39.000 estudiantes abandonaron la universidad en Colombia.” Accessed: Mar. 18, 2023. [Online]. Available: https://caracol.com.co/programa/2021/11/04/sanamente/1636049871_761122.html[9] Sistema para la Prevención de la Deserción de la Educación Superior, “Estadísticas de Deserción - Sistemas información.” Accessed: Mar. 18, 2023. [Online]. Available: https://www.mineducacion.gov.co/sistemasinfo/spadies/Informacion-Institucional/357549:Estadisticas-de-Desercion[10] E. Barreno-Vereau, “Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria,” Interfases, vol. 0, no. 005, p. 45, Feb. 2012, doi: 10.26439/Interfases2012.N005.149.[11] D. Santín González, “Detección de alumnos de riesgo y medición de la eficiencia de centros escolares mediante redes neuronales,” 1999. [Online]. Available: http://www.ucm.es/BUCM/cee/doc/9902/9902.htmm[12] H. Felizzola Jiménez, Y. Adriana, J. Arias, A. María, C. Pastrana, and F. Villa Pedroza, “Modelo de predicción para la deserción temprana en la facultad de Ingeniería de la Universidad de la Salle,” 2018.[13] K. R. Vergaray, “Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,” Innovación y Software, vol. 2, no. 2, pp. 6–13, Sep. 2021, Accessed: Feb. 25, 2023. [Online]. Available: https://revistas.ulasalle.edu.pe/innosoft/article/view/40[14] R. I. Castro López, “Aplicación de técnicas de Machine Learning para el estudio de deserción temprana y egreso oportuno en estudiantes de ingeniería de la facultad de ciencias físicas y matemáticas.” Accessed: Feb. 25, 2023. [Online]. Available: https://repositorio.uchile.cl/bitstream/handle/2250/178598/Aplicacion-de-tecnicas-de-Machine-Learning-para-el-estudio-de-desercion-temprana-y-egreso-oportuno-en-estudiantes-de-Ingenieria-de-la-Facultad-de-Ciencias%20Fisicas-y-Matematicas.pdf?sequence=1&isAllowed=y[15] A. Jose and C. Garcia, “Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos,” pp. 1–121, 2020.[16] H. Y. Ayala Yaguara, M. Valenzuela Sabogal, and A. Espinosa García, “Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca.” Accessed: Feb. 25, 2023. [Online]. Available: https://journal.universidadean.edu.co/index.php/Revistao/article/view/2676/2087[17] V. De La Cruz, “Diseño de un modelo predictivo basado en Machine Learning para el control de la deserción de estudiantes en la Universidad Ricardo Palma,” 2019.[18] M. L. Avila Pérez, “Modelo De Predicción De Deserción Estudiantil, Apoyado En Tecnologías De Data Mining, En Un Curso De Primera Matrícula De La Escuela ECBTI De La UNAD,” pp. 1–151, 2021.[19] J. D. T. D. F. T. Diofanor Acevedo, “Análisis de la Deserción Estudiantil en el Programa Ingeniería de Alimentos de la Universidad de Cartagena durante el Periodo Académico 2009 - 2013,” Cartagena, 2015.[20] Antonio Berlanga, “El camino desde la Inteligencia Artificial al Big Data.”[21] “Minería de datos: Qué es y por qué es importante | SAS.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.sas.com/es_co/insights/analytics/data-mining.html[22] D. S. G. César Pérez López, Minería de datos. Técnicas y herramientas, vol. 1. 2007.[23] E. M. Rojas, “Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo,” 2020.[24] “‘Machine Learning’: definición, tipos y aplicaciones prácticas - Iberdrola.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico[25] Wiley, Fundamentals and Methods of Machine and Deep Learning, Algorithms, Tools, and Applications. 2022.[26] Sandra Navarro, “KeepCoding Bootcamps.” Accessed: May 12, 2024. [Online]. Available: https://keepcoding.io/blog/que-es-gridsearchcv/[27] “sklearn.model_selection.GridSearchCV — scikit-learn 1.4.2 documentation.” Accessed: May 19, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html[28] J. Carlos González Sánchez and M. Javier Peñaloza Pérez, “Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en machine learning.,” 2021.[29] “Conceptos básicos de ayuda de CRISP-DM - Documentación de IBM.” Accessed: Feb. 08, 2024. [Online]. Available: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview[30] IBM, “¿Qué es un bosque aleatorio? | IBM.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.ibm.com/mx-es/topics/random-forest[31] “sklearn.ensemble.RandomForestClassifier — scikit-learn 1.4.2 documentation.” Accessed: May 18, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html[32] L. G. Díaz Monroy and M. A. Morales Rivera, Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Facultrad de Ciencias, Departamento de Estadística, 2009.[33] “Prueba de ji cuadrado de bondad de ajuste | Introducción a la estadística | JMP.” Accessed: May 04, 2024. [Online]. Available: https://www.jmp.com/es_co/statistics-knowledge-portal/chi-square-test/chi-square-goodness-of-fit-test.html[34] “La matriz de confusión y sus métricas – Inteligencia Artificial –.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/PublicationORIGINAL2024_Trabajo_Grado.pdf2024_Trabajo_Grado.pdfapplication/pdf1633773https://repository.ucc.edu.co/bitstreams/e91d7000-5f77-4a88-873f-2b9b0d5aeb97/download985b07be81e42e74311740ff9181781bMD572024_Licencia_Uso.pdf2024_Licencia_Uso.pdfapplication/pdf221089https://repository.ucc.edu.co/bitstreams/d8dfef58-98eb-4fe8-a290-4b8c675b97b1/download507a5da5578083e4c22db331d70d27adMD56CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repository.ucc.edu.co/bitstreams/bbefac87-21eb-4416-bc74-8283729f3721/download4460e5956bc1d1639be9ae6146a50347MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-84334https://repository.ucc.edu.co/bitstreams/f8a4ff56-103e-4bde-bb15-21aad6d89e65/download3bce4f7ab09dfc588f126e1e36e98a45MD55TEXT2024_Trabajo_Grado.pdf.txt2024_Trabajo_Grado.pdf.txtExtracted texttext/plain102036https://repository.ucc.edu.co/bitstreams/4d968cae-a239-4f4a-8bd8-4d60be5ebe1a/downloadd1212ade6f89d57728bc133cdb7d0eacMD5102024_Licencia_Uso.pdf.txt2024_Licencia_Uso.pdf.txtExtracted texttext/plain5884https://repository.ucc.edu.co/bitstreams/54c01867-069d-4d21-84fa-d0737a5a5ca2/download944f5016906a3ba7cf7854471b598314MD58THUMBNAIL2024_Trabajo_Grado.pdf.jpg2024_Trabajo_Grado.pdf.jpgGenerated Thumbnailimage/jpeg6680https://repository.ucc.edu.co/bitstreams/128d0d82-bc57-451c-be99-7c9ccb2dfa3f/download44ddecca48406bceb2432bd9618efabeMD5112024_Licencia_Uso.pdf.jpg2024_Licencia_Uso.pdf.jpgGenerated Thumbnailimage/jpeg12267https://repository.ucc.edu.co/bitstreams/e55ac4f0-c53e-4f42-b16c-baa9938d884d/download540ee1824142dfed4163ee9121349109MD5920.500.12494/56199oai:repository.ucc.edu.co:20.500.12494/561992024-08-21 18:09:26.078https://creativecommons.org/licenses/by-nc-nd/4.0/Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)open.accesshttps://repository.ucc.edu.coRepositorio Institucional Universidad Cooperativa de Colombiabdigital@metabiblioteca.comVU5JVkVSU0lEQUQgQ09PUEVSQVRJVkEgREUgQ09MT01CSUEKUkVQT1NJVE9SSU9TIElOU1RJVFVDSU9OQUxFUwpMSUNFTkNJQSBERSBVU08KClBvciBtZWRpbyBkZWwgcHJlc2VudGUgZG9jdW1lbnRvLCBlbCBBdXRvcihlcyksIG1heW9yIChlcykgZGUgZWRhZCwgcXVpZW4gZW4gYWRlbGFudGUgc2UgZGVub21pbmFyw6EgZWwgQVVUT1IsIGNvbmZpZXJlIGEgbGEgVU5JVkVSU0lEQUQgQ09PUEVSQVRJVkEgREUgQ09MT01CSUEsIGNvbiBOSVQuIDg2MC0wMjk5MjQtNywgdW5hIExJQ0VOQ0lBIERFIFVTTyBkZSBvYnJhLCBiYWpvIGxhcyBzaWd1aWVudGVzIGNvbmRpY2lvbmVzLgoKQ0zDgVVTVUxBUwoKUFJJTUVSQS4gT2JqZXRvLiBFTCBBVVRPUiBwb3IgZXN0ZSBhY3RvIGF1dG9yaXphIGxhIHV0aWxpemFjacOzbiBkZSBsYSBvYnJhLCBkZSBjb25mb3JtaWRhZCBjb24gbG8gZXN0aXB1bGFkbyBhIGNvbnRpbnVhY2nDs246IAoKKGEpIFBhcmEgZWZlY3RvcyBkZSBsYSBwcmVzZW50ZSBsaWNlbmNpYSBzZSBhdXRvcml6YSBsYSByZXByb2R1Y2Npw7NuIGRlIGxhIG9icmEgYW50ZXJpb3JtZW50ZSBjaXRhZGEsIGxhIGN1YWwgc2UgYWxvamFyw6EgZW4gZm9ybWF0byBkaWdpdGFsIGVuIGxhcyBwbGF0YWZvcm1hcyBvIHJlcG9zaXRvcmlvcyBhZG1pbmlzdHJhZG9zIHBvciBsYSBVTklWRVJTSURBRCBvIGVuIG90cm8gdGlwbyBkZSByZXBvc2l0b3Jpb3MgZXh0ZXJub3MgbyBww6FnaW5hcyB3ZWIgZXNjb2dpZG9zIHBvciBsYSBVTklWRVJTSURBRCwgcGFyYSBmaW5lcyBkZSBkaWZ1c2nDs24geSBkaXZ1bGdhY2nDs24uIEFkaWNpb25hbG1lbnRlLCBzZSBhdXRvcml6YSBhIHF1ZSBsb3MgdXN1YXJpb3MgaW50ZXJub3MgeSBleHRlcm5vcyBkZSBkaWNoYXMgcGxhdGFmb3JtYXMgbyByZXBvc2l0b3Jpb3MgcmVwcm9kdXpjYW4gbyBkZXNjYXJndWVuIGxhIG9icmEsIHNpbiDDoW5pbW8gZGUgbHVjcm8sIHBhcmEgZmluZXMgcHJpdmFkb3MsIGVkdWNhdGl2b3MgbyBhY2Fkw6ltaWNvczsgc2llbXByZSB5IGN1YW5kbyBubyBzZSB2aW9sZW4gYWN1ZXJkb3MgY29uIGVkaXRvcmVzLCBwZXJpb2RvcyBkZSBlbWJhcmdvIG8gYWN1ZXJkb3MgZGUgY29uZmlkZW5jaWFsaWRhZCBxdWUgYXBsaXF1ZW4uCgooYikgU2UgYXV0b3JpemEgbGEgY29tdW5pY2FjacOzbiBww7pibGljYSB5IGxhIHB1ZXN0YSBhIGRpc3Bvc2ljacOzbiBkZSBsYSBvYnJhIG1lbmNpb25hZGEsIGVuIGFjY2VzbyBhYmllcnRvLCBwYXJhIHN1IHV0aWxpemFjacOzbiBlbiBsYXMgcGxhdGFmb3JtYXMgbyByZXBvc2l0b3Jpb3MgYWRtaW5pc3RyYWRvcyBwb3IgbGEgVU5JVkVSU0lEQUQuCgooYykgTG8gYW50ZXJpb3IgZXN0YXLDoSBzdWpldG8gYSBsYXMgZGVmaW5pY2lvbmVzIGNvbnRlbmlkYXMgZW4gbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MyB5IGxhIExleSAyMyBkZSAxOTgyLgoKClNFR1VOREEuIE9yaWdpbmFsaWRhZCB5IHJlY2xhbWFjaW9uZXMuIEVsIEFVVE9SIGRlY2xhcmEgcXVlIGxhIE9CUkEgZXMgb3JpZ2luYWwgeSBxdWUgZXMgZGUgc3UgY3JlYWNpw7NuIGV4Y2x1c2l2YSwgbm8gZXhpc3RpZW5kbyBpbXBlZGltZW50byBkZSBjdWFscXVpZXIgbmF0dXJhbGV6YSAoZW1iYXJnb3MsIHVzbyBkZSBtYXRlcmlhbCBwcm90ZWdpZG8gcG9yIGRlcmVjaG9zIGRlIGF1dG9yKSBwYXJhIGxhIGNvbmNlc2nDs24gZGUgbG9zIGRlcmVjaG9zIHByZXZpc3RvcyBlbiBlc3RlIGFjdWVyZG8uIEVsIEFVVE9SIHJlc3BvbmRlcsOhIHBvciBjdWFscXVpZXIgYWNjacOzbiBkZSByZWl2aW5kaWNhY2nDs24sIHBsYWdpbyB1IG90cmEgY2xhc2UgZGUgcmVjbGFtYWNpw7NuIHF1ZSBhbCByZXNwZWN0byBwdWRpZXJhIHNvYnJldmVuaXIuCgpURVJDRVJBLiBDb250cmFwcmVzdGFjacOzbi4gRWwgQVVUT1IgYXV0b3JpemEgYSBxdWUgc3Ugb2JyYSBzZWEgdXRpbGl6YWRhIGRlIGNvbmZvcm1pZGFkIGNvbiBsYSBjbMOhdXN1bGEgUFJJTUVSQSBkZSBmb3JtYSBncmF0dWl0YSwgZXMgZGVjaXIsIHF1ZSBsYSB1dGlsaXphY2nDs24gZGUgbGEgbWlzbWEgbm8gZ2VuZXJhIG5pbmfDum4gcGFnbyBvIHJlZ2Fsw61hcyBlbiBmYXZvciBkZSBlc3RlLgoKQ1VBUlRBLiBUaXR1bGFyaWRhZCBkZSBkZXJlY2hvcy4gRWwgcHJlc2VudGUgY29udHJhdG8gbm8gdHJhbnNmaWVyZSBsYSB0aXR1bGFyaWRhZCBkZSBsb3MgZGVyZWNob3MgcGF0cmltb25pYWxlcyBzb2JyZSBsYXMgb2JyYXMgYW50ZXJpb3JtZW50ZSBtZW5jaW9uYWRhcyBhIGxhIFVOSVZFUlNJREFELiDDmm5pY2FtZW50ZSBoYWNlIHJlbGFjacOzbiBhIHVuYSBsaWNlbmNpYSBubyBleGNsdXNpdmEgZW4gbG9zIHTDqXJtaW5vcyB5IGNvbmRpY2lvbmVzIGFudGVyaW9ybWVudGUgcGFjdGFkb3MuCgpRVUlOVEEuIENyw6lkaXRvcy4gTGEgVU5JVkVSU0lEQUQgc2UgY29tcHJvbWV0ZSBhIGRhciBhbCBBVVRPUiwgZWwgcmVjb25vY2ltaWVudG8gZGVudHJvIGNhZGEgZm9ybWEgZGUgdXRpbGl6YWNpw7NuIGVuIGxhIG9icmEuIExvcyBjcsOpZGl0b3MgZGViZW4gZmlndXJhciBlbiBjYWRhIHVubyBkZSBsb3MgZm9ybWF0b3MgbyByZWdpc3Ryb3MgZGUgcHVibGljYWNpw7NuLiBObyBjb25zdGl0dWlyw6EgdW5hIHZpb2xhY2nDs24gYSBsb3MgZGVyZWNob3MgbW9yYWxlcyBkZWwgYXV0b3IgbGEgbm8gcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBvIGRlbcOhcyB1dGlsaXphY2lvbmVzIGRlIGxhIG9icmEuIExhIHV0aWxpemFjacOzbiBvIG5vIGRlIGxhIG9icmEsIGFzw60gY29tbyBzdSBmb3JtYSBkZSB1dGlsaXphY2nDs24gc2Vyw6EgZmFjdWx0YWQgZXhjbHVzaXZhIGRlIGxhIFVOSVZFUlNJREFELgogClNFWFRBLiBEdXJhY2nDs24geSB0ZXJyaXRvcmlvLiBMYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28gcXVlIHNlIG90b3JnYSBhIGZhdm9yIGRlIGxhIFVOSVZFUlNJREFEIHRlbmRyw6EgdW5hIGR1cmFjacOzbiBlcXVpdmFsZW50ZSBhbCB0w6lybWlubyBkZSBwcm90ZWNjacOzbiBsZWdhbCBkZSBsYSBvYnJhIHkgcGFyYSB0b2RvcyBsb3MgcGHDrXNlcyBkZWwgbXVuZG8uCgpTw4lQVElNQS4gVXNvIGRlIENyZWF0aXZlIENvbW1vbnMuIEVsIEFVVE9SIGF1dG9yaXphcsOhIGxhIGRpZnVzacOzbiBkZSBzdSBjb250ZW5pZG8gYmFqbyB1bmEgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBhdHJpYnVjacOzbiA0LjAgaW50ZXJuYWNpb25hbCwgcXVlIGRlYmVyw6EgaW5jbHVpcnNlIGVuIGVsIGNvbnRlbmlkby4gCgpPQ1RBVkEuIERlcmVjaG8gZGUgZXhjbHVzacOzbi4gQ2FkYSBhdXRvciBwdWVkZSBpbmRpY2FyIGVuIGVsIG1vbWVudG8gZGUgZGVww7NzaXRvIGRlbCBjb250ZW5pZG8gcXVlIGVsIHRleHRvIGNvbXBsZXRvIGRlIGxhIHByb2R1Y2Npw7NuIGFjYWTDqW1pY2EgbyBjaWVudMOtZmljYSBubyBlc3RlIGNvbiBhY2Nlc28gYWJpZXJ0byBlbiBlbCBSZXBvc2l0b3JpbyBJbnN0aXR1Y2lvbmFsIHBvciBtb3Rpdm9zIGRlIGNvbmZpZGVuY2lhbGlkYWQsIHBvcnF1ZSBzZSBlbmN1ZW50cmUgZW4gdsOtYXMgZGUgb2J0ZW5lciB1biBkZXJlY2hvIGRlIHByb3BpZWRhZCBpbmR1c3RyaWFsIG8gZXhpc3RpciBhY3VlcmRvcyBwcmV2aW9zIGNvbiB0ZXJjZXJvcyAoZWRpdG9yaWFsZXMsIHJldmlzdGFzIGNpZW50w61maWNhcywgb3RyYXMgaW5zdGl0dWNpb25lcykuIEVsIGF1dG9yIHNlIGNvbXByb21ldGUgYSBkZXBvc2l0YXIgbG9zIG1ldGFkYXRvcyBlIGluZm9ybWFyIGVsIHRpZW1wbyBkZSBlbWJhcmdvIGR1cmFudGUgZWwgY3VhbCBlbCB0ZXh0byBjb21wbGV0byB0ZW5kcsOhIGFjY2VzbyByZXN0cmluZ2lkby4gCgpOT1ZFTkEuIEVsIEFVVE9SIGFsIGFjZXB0YXIgZXN0YSBsaWNlbmNpYSBhZHVjZSBxdWUgZXN0YSBwcm9kdWNjacOzbiBzZSBkZXNhcnJvbGzDsyBlbiBlbCBwZXJpb2RvIGVuIHF1ZSBzZSBlbmN1ZW50cmEgY29uIHbDrW5jdWxvcyBjb24gTGEgVW5pdmVyc2lkYWQuCgpEw4lDSU1BLiBOb3JtYXMgYXBsaWNhYmxlcy4gUGFyYSBsYSBpbnRlcnByZXRhY2nDs24geSBjdW1wbGltaWVudG8gZGVsIHByZXNlbnRlIGFjdWVyZG8gbGFzIHBhcnRlcyBzZSBzb21ldGVuIGEgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgbGEgTGV5IDIzIGRlIDE5ODIgeSBkZW3DoXMgbm9ybWFzIGFwbGljYWJsZXMgZGUgQ29sb21iaWEuIEFkZW3DoXMsIGEgbGFzIG5vcm1hcyBJbnN0aXR1Y2lvbmFsZXMgcXVlIGFwbGlxdWVuLgoKTGEgcHJlc2VudGUgbGljZW5jaWEgc2UgYXV0b3JpemEgZW4gbGEgZmVjaGEgZGUgcHVibGljYWNpw7NuIGVuIGxvcyByZXBvc2l0b3Jpb3MgaW5zdGl0dWNpb25hbGVzLgo=