Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning
En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpi...
- Autores:
-
Galvis Martínez, Miguel Ángel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad Cooperativa de Colombia
- Repositorio:
- Repositorio UCC
- Idioma:
- spa
- OAI Identifier:
- oai:repository.ucc.edu.co:20.500.12494/56199
- Acceso en línea:
- https://hdl.handle.net/20.500.12494/56199
- Palabra clave:
- 000 - Ciencias de la computación, información y obras generales
Deserción
Modelos computacionales
Minería de datos
Desertion
Computational models
Data mining
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
id |
COOPER2_12973df72cee18a82d2f5dc03f7dd6a4 |
---|---|
oai_identifier_str |
oai:repository.ucc.edu.co:20.500.12494/56199 |
network_acronym_str |
COOPER2 |
network_name_str |
Repositorio UCC |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
title |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
spellingShingle |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning 000 - Ciencias de la computación, información y obras generales Deserción Modelos computacionales Minería de datos Desertion Computational models Data mining |
title_short |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
title_full |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
title_fullStr |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
title_full_unstemmed |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
title_sort |
Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning |
dc.creator.fl_str_mv |
Galvis Martínez, Miguel Ángel |
dc.contributor.advisor.none.fl_str_mv |
Nova Martínez, Manuel Arturo Porras García, Yerson Ferney |
dc.contributor.author.none.fl_str_mv |
Galvis Martínez, Miguel Ángel |
dc.subject.ddc.none.fl_str_mv |
000 - Ciencias de la computación, información y obras generales |
topic |
000 - Ciencias de la computación, información y obras generales Deserción Modelos computacionales Minería de datos Desertion Computational models Data mining |
dc.subject.proposal.spa.fl_str_mv |
Deserción Modelos computacionales Minería de datos |
dc.subject.proposal.none.fl_str_mv |
Desertion Computational models Data mining |
description |
En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpieza y análisis exploratorio se adecuaron con el objetivo de entrenar modelos computacionales de Random Forest para determinar la probabilidad de que un estudiante abandone sus estudios académicos. En este documento en primer lugar se realiza una descripción sobre lo que es la deserción basada en datos y estudios nacionales como internacionales y se contextualiza la problemática en Colombia, posteriormente se explican los conceptos que se usaran en esta investigación tales como machine learning, data mining, modelos computacionales, métricas de evaluación, entre otros. Luego se detalla el procedimiento del trabajo que se realizó en la recolección de más de 800 registros de estudiantes por medio de una serie de encuestas realizadas en los periodos académicos 2023-10 y 2023-20, con más de 45 preguntas, donde se tomó una muestra de 483 estudiantes que pertenecen a la facultad de ingeniería la cual está conformada por ingeniería de sistemas e ingeniería civil. Estos 2 datasets fueron sometidos a un análisis descriptivo con el fin de unificarlos en uno solo, en donde se aplicaron métodos de limpieza y estadísticos para ordenar la información de forma óptima para el entrenamiento de los modelos. La parte final del trabajo se concentra en el entrenamiento de modelos computacionales basados en el Algoritmo Random Forest, el cual es implementado mediante el uso de la librería sklearn.ensemble.RandomForestClassifier de Python y la metodología de búsqueda amplia GridsearchCv mediante la librería sklearn.model_selection.GridSearchCV para optimización de parámetros. Bajo este dataset se determina una configuración óptima de parámetros que entrega un 46.4 % de la métrica de desempeño. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-07-04T19:59:36Z |
dc.date.available.none.fl_str_mv |
2024-07-04T19:59:36Z |
dc.date.issued.none.fl_str_mv |
2024-06-25 |
dc.type.none.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.none.fl_str_mv |
Text |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.citation.none.fl_str_mv |
Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199 |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12494/56199 |
identifier_str_mv |
Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199 |
url |
https://hdl.handle.net/20.500.12494/56199 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.references.none.fl_str_mv |
[1] A. M. Mariano, A. B. De Magalhães Lelis Ferreira, M. R. Santos, M. L. Castilho, and A. C. F. L. C. Bastos, “Decision trees for predicting dropout in Engineering Course students in Brazil,” in Procedia Computer Science, Elsevier B.V., 2022, pp. 1113–1120. doi: 10.1016/j.procs.2022.11.285. [2] María Camila Jiménez, “Abandono universitario tarea en la que Iberoamérica se sigue rajando.” Accessed: Apr. 17, 2024. [Online]. Available: https://periodico.unal.edu.co/articulos/abandono-universitario-tarea-en-la-que-iberoamerica-se-sigue-rajando [3] A. Gonzalez-Nucamendi, J. Noguez, L. Neri, V. Robledo-Rella, and R. M. G. García-Castelán, “Predictive analytics study to determine undergraduate students at risk of dropout,” Front Educ (Lausanne), vol. 8, 2023, doi: 10.3389/feduc.2023.1244686. [4] E. Ministerio, “Estadísticas de deserción estudiantil, permanencia y graduación en educación superior Universitario Tecnológico Técnico profesional,” 2017. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles- [5] E. Chinkes, “Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una facultad,” 2018. [6] J. Mesarić and D. Šebalj, “Decision trees for predicting the academic success of students,” Croatian Operational Research Review, vol. 367, pp. 367–388, 2016, doi: 10.17535/crorr.2016.0025. [7] Ministerio de Educación Nacional, “Ministerio de Educación Nacional Subdirección de Desarrollo Sectorial,” 2013. [Online]. Available: www.mineducacion.gov.co [8] Caracol Radio, “Más de 39.000 estudiantes abandonaron la universidad en Colombia.” Accessed: Mar. 18, 2023. [Online]. Available: https://caracol.com.co/programa/2021/11/04/sanamente/1636049871_761122.html [9] Sistema para la Prevención de la Deserción de la Educación Superior, “Estadísticas de Deserción - Sistemas información.” Accessed: Mar. 18, 2023. [Online]. Available: https://www.mineducacion.gov.co/sistemasinfo/spadies/Informacion-Institucional/357549:Estadisticas-de-Desercion [10] E. Barreno-Vereau, “Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria,” Interfases, vol. 0, no. 005, p. 45, Feb. 2012, doi: 10.26439/Interfases2012.N005.149. [11] D. Santín González, “Detección de alumnos de riesgo y medición de la eficiencia de centros escolares mediante redes neuronales,” 1999. [Online]. Available: http://www.ucm.es/BUCM/cee/doc/9902/9902.htmm [12] H. Felizzola Jiménez, Y. Adriana, J. Arias, A. María, C. Pastrana, and F. Villa Pedroza, “Modelo de predicción para la deserción temprana en la facultad de Ingeniería de la Universidad de la Salle,” 2018. [13] K. R. Vergaray, “Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,” Innovación y Software, vol. 2, no. 2, pp. 6–13, Sep. 2021, Accessed: Feb. 25, 2023. [Online]. Available: https://revistas.ulasalle.edu.pe/innosoft/article/view/40 [14] R. I. Castro López, “Aplicación de técnicas de Machine Learning para el estudio de deserción temprana y egreso oportuno en estudiantes de ingeniería de la facultad de ciencias físicas y matemáticas.” Accessed: Feb. 25, 2023. [Online]. Available: https://repositorio.uchile.cl/bitstream/handle/2250/178598/Aplicacion-de-tecnicas-de-Machine-Learning-para-el-estudio-de-desercion-temprana-y-egreso-oportuno-en-estudiantes-de-Ingenieria-de-la-Facultad-de-Ciencias%20Fisicas-y-Matematicas.pdf?sequence=1&isAllowed=y [15] A. Jose and C. Garcia, “Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos,” pp. 1–121, 2020. [16] H. Y. Ayala Yaguara, M. Valenzuela Sabogal, and A. Espinosa García, “Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca.” Accessed: Feb. 25, 2023. [Online]. Available: https://journal.universidadean.edu.co/index.php/Revistao/article/view/2676/2087 [17] V. De La Cruz, “Diseño de un modelo predictivo basado en Machine Learning para el control de la deserción de estudiantes en la Universidad Ricardo Palma,” 2019. [18] M. L. Avila Pérez, “Modelo De Predicción De Deserción Estudiantil, Apoyado En Tecnologías De Data Mining, En Un Curso De Primera Matrícula De La Escuela ECBTI De La UNAD,” pp. 1–151, 2021. [19] J. D. T. D. F. T. Diofanor Acevedo, “Análisis de la Deserción Estudiantil en el Programa Ingeniería de Alimentos de la Universidad de Cartagena durante el Periodo Académico 2009 - 2013,” Cartagena, 2015. [20] Antonio Berlanga, “El camino desde la Inteligencia Artificial al Big Data.” [21] “Minería de datos: Qué es y por qué es importante | SAS.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.sas.com/es_co/insights/analytics/data-mining.html [22] D. S. G. César Pérez López, Minería de datos. Técnicas y herramientas, vol. 1. 2007. [23] E. M. Rojas, “Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo,” 2020. [24] “‘Machine Learning’: definición, tipos y aplicaciones prácticas - Iberdrola.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico [25] Wiley, Fundamentals and Methods of Machine and Deep Learning, Algorithms, Tools, and Applications. 2022. [26] Sandra Navarro, “KeepCoding Bootcamps.” Accessed: May 12, 2024. [Online]. Available: https://keepcoding.io/blog/que-es-gridsearchcv/ [27] “sklearn.model_selection.GridSearchCV — scikit-learn 1.4.2 documentation.” Accessed: May 19, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html [28] J. Carlos González Sánchez and M. Javier Peñaloza Pérez, “Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en machine learning.,” 2021. [29] “Conceptos básicos de ayuda de CRISP-DM - Documentación de IBM.” Accessed: Feb. 08, 2024. [Online]. Available: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview [30] IBM, “¿Qué es un bosque aleatorio? | IBM.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.ibm.com/mx-es/topics/random-forest [31] “sklearn.ensemble.RandomForestClassifier — scikit-learn 1.4.2 documentation.” Accessed: May 18, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html [32] L. G. Díaz Monroy and M. A. Morales Rivera, Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Facultrad de Ciencias, Departamento de Estadística, 2009. [33] “Prueba de ji cuadrado de bondad de ajuste | Introducción a la estadística | JMP.” Accessed: May 04, 2024. [Online]. Available: https://www.jmp.com/es_co/statistics-knowledge-portal/chi-square-test/chi-square-goodness-of-fit-test.html [34] “La matriz de confusión y sus métricas – Inteligencia Artificial –.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/ |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.creativecommons.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
89 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, Villavicencio |
dc.publisher.program.none.fl_str_mv |
Ingeniería de Sistemas |
dc.publisher.faculty.none.fl_str_mv |
Ingenierías |
dc.publisher.place.none.fl_str_mv |
Villavicencio |
dc.publisher.branch.none.fl_str_mv |
Villavicencio |
publisher.none.fl_str_mv |
Universidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, Villavicencio |
institution |
Universidad Cooperativa de Colombia |
bitstream.url.fl_str_mv |
https://repository.ucc.edu.co/bitstreams/e91d7000-5f77-4a88-873f-2b9b0d5aeb97/download https://repository.ucc.edu.co/bitstreams/d8dfef58-98eb-4fe8-a290-4b8c675b97b1/download https://repository.ucc.edu.co/bitstreams/bbefac87-21eb-4416-bc74-8283729f3721/download https://repository.ucc.edu.co/bitstreams/f8a4ff56-103e-4bde-bb15-21aad6d89e65/download https://repository.ucc.edu.co/bitstreams/4d968cae-a239-4f4a-8bd8-4d60be5ebe1a/download https://repository.ucc.edu.co/bitstreams/54c01867-069d-4d21-84fa-d0737a5a5ca2/download https://repository.ucc.edu.co/bitstreams/128d0d82-bc57-451c-be99-7c9ccb2dfa3f/download https://repository.ucc.edu.co/bitstreams/e55ac4f0-c53e-4f42-b16c-baa9938d884d/download |
bitstream.checksum.fl_str_mv |
985b07be81e42e74311740ff9181781b 507a5da5578083e4c22db331d70d27ad 4460e5956bc1d1639be9ae6146a50347 3bce4f7ab09dfc588f126e1e36e98a45 d1212ade6f89d57728bc133cdb7d0eac 944f5016906a3ba7cf7854471b598314 44ddecca48406bceb2432bd9618efabe 540ee1824142dfed4163ee9121349109 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Cooperativa de Colombia |
repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
_version_ |
1814246630557220864 |
spelling |
Nova Martínez, Manuel ArturoPorras García, Yerson FerneyGalvis Martínez, Miguel Ángel2024-07-04T19:59:36Z2024-07-04T19:59:36Z2024-06-25Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199https://hdl.handle.net/20.500.12494/56199En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpieza y análisis exploratorio se adecuaron con el objetivo de entrenar modelos computacionales de Random Forest para determinar la probabilidad de que un estudiante abandone sus estudios académicos. En este documento en primer lugar se realiza una descripción sobre lo que es la deserción basada en datos y estudios nacionales como internacionales y se contextualiza la problemática en Colombia, posteriormente se explican los conceptos que se usaran en esta investigación tales como machine learning, data mining, modelos computacionales, métricas de evaluación, entre otros. Luego se detalla el procedimiento del trabajo que se realizó en la recolección de más de 800 registros de estudiantes por medio de una serie de encuestas realizadas en los periodos académicos 2023-10 y 2023-20, con más de 45 preguntas, donde se tomó una muestra de 483 estudiantes que pertenecen a la facultad de ingeniería la cual está conformada por ingeniería de sistemas e ingeniería civil. Estos 2 datasets fueron sometidos a un análisis descriptivo con el fin de unificarlos en uno solo, en donde se aplicaron métodos de limpieza y estadísticos para ordenar la información de forma óptima para el entrenamiento de los modelos. La parte final del trabajo se concentra en el entrenamiento de modelos computacionales basados en el Algoritmo Random Forest, el cual es implementado mediante el uso de la librería sklearn.ensemble.RandomForestClassifier de Python y la metodología de búsqueda amplia GridsearchCv mediante la librería sklearn.model_selection.GridSearchCV para optimización de parámetros. Bajo este dataset se determina una configuración óptima de parámetros que entrega un 46.4 % de la métrica de desempeño.In this undergraduate work research, records of socioeconomic, personal and academic perception data were collected from active students of the engineering faculty of the Universidad Cooperativa de Colombia, Villavicencio headquarters, which through a process of cleaning and exploratory analysis were adapted with the objective of training Random Forest computational models to determine the probability of a student abandoning their academic studies. In this document, first of all, a description is made of what desertion is based on national and international data and studies and the problem in Colombia is contextualized. Later, the concepts that will be used in this research are explained, such as machine learning, data mining. , computational models, evaluation metrics, among others. Then the procedure of the work that was carried out in the collection of more than 800 student records is detailed through a series of surveys carried out in the 2023-10 and 2023-20 academic periods, with more than 45 questions, where a sample of 483 students who belong to the engineering faculty which is made up of systems engineering and civil engineering. These 2 datasets were subjected to a descriptive analysis in order to unify them into a single one, where cleaning and statistical methods were applied to organize the information optimally for training the models. The final part of the work focuses on the training of computational models based on the Random Forest Algorithm, which is implemented through the use of the sklearn.ensemble.RandomForestClassifier Python library and the broad search methodology GridsearchCv through the sklearn.model_selection library. .GridSearchCV for parameter optimization. Under this dataset, an optimal parameter configuration is determined that delivers 46.4% of the performance metric.I. Introducción -- II. Planteamiento del problema -- III. Objetivos -- IV. Justificación -- V. Antecedentes -- VI. Marco Teórico -- VII. Metodología -- VIII. Desarrollo del trabajo -- IX. Fase de recolección de datos. -- X. Fase de análisis y unificación de los 2 datasets (Estudio y compresión de los datos). -- XI. Fase de análisis, limpieza y ordenamiento de los datos. -- XII. Análisis exploratorio de datos y correlaciones -- XIII. Conclusiones -- XIV. Referencias -- XV. Anexo --Ingeniero de Sistemas89 p.application/pdfspaUniversidad Cooperativa de Colombia, Facultad de Ingenierías, Ingeniería de Sistemas, VillavicencioIngeniería de SistemasIngenieríasVillavicencioVillavicenciohttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2000 - Ciencias de la computación, información y obras generalesDeserciónModelos computacionalesMinería de datosDesertionComputational modelsData miningModelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine LearningTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttp://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/acceptedVersion[1] A. M. Mariano, A. B. De Magalhães Lelis Ferreira, M. R. Santos, M. L. Castilho, and A. C. F. L. C. Bastos, “Decision trees for predicting dropout in Engineering Course students in Brazil,” in Procedia Computer Science, Elsevier B.V., 2022, pp. 1113–1120. doi: 10.1016/j.procs.2022.11.285.[2] María Camila Jiménez, “Abandono universitario tarea en la que Iberoamérica se sigue rajando.” Accessed: Apr. 17, 2024. [Online]. Available: https://periodico.unal.edu.co/articulos/abandono-universitario-tarea-en-la-que-iberoamerica-se-sigue-rajando[3] A. Gonzalez-Nucamendi, J. Noguez, L. Neri, V. Robledo-Rella, and R. M. G. García-Castelán, “Predictive analytics study to determine undergraduate students at risk of dropout,” Front Educ (Lausanne), vol. 8, 2023, doi: 10.3389/feduc.2023.1244686.[4] E. Ministerio, “Estadísticas de deserción estudiantil, permanencia y graduación en educación superior Universitario Tecnológico Técnico profesional,” 2017. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-[5] E. Chinkes, “Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una facultad,” 2018.[6] J. Mesarić and D. Šebalj, “Decision trees for predicting the academic success of students,” Croatian Operational Research Review, vol. 367, pp. 367–388, 2016, doi: 10.17535/crorr.2016.0025.[7] Ministerio de Educación Nacional, “Ministerio de Educación Nacional Subdirección de Desarrollo Sectorial,” 2013. [Online]. Available: www.mineducacion.gov.co[8] Caracol Radio, “Más de 39.000 estudiantes abandonaron la universidad en Colombia.” Accessed: Mar. 18, 2023. [Online]. Available: https://caracol.com.co/programa/2021/11/04/sanamente/1636049871_761122.html[9] Sistema para la Prevención de la Deserción de la Educación Superior, “Estadísticas de Deserción - Sistemas información.” Accessed: Mar. 18, 2023. [Online]. Available: https://www.mineducacion.gov.co/sistemasinfo/spadies/Informacion-Institucional/357549:Estadisticas-de-Desercion[10] E. Barreno-Vereau, “Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria,” Interfases, vol. 0, no. 005, p. 45, Feb. 2012, doi: 10.26439/Interfases2012.N005.149.[11] D. Santín González, “Detección de alumnos de riesgo y medición de la eficiencia de centros escolares mediante redes neuronales,” 1999. [Online]. Available: http://www.ucm.es/BUCM/cee/doc/9902/9902.htmm[12] H. Felizzola Jiménez, Y. Adriana, J. Arias, A. María, C. Pastrana, and F. Villa Pedroza, “Modelo de predicción para la deserción temprana en la facultad de Ingeniería de la Universidad de la Salle,” 2018.[13] K. R. Vergaray, “Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,” Innovación y Software, vol. 2, no. 2, pp. 6–13, Sep. 2021, Accessed: Feb. 25, 2023. [Online]. Available: https://revistas.ulasalle.edu.pe/innosoft/article/view/40[14] R. I. Castro López, “Aplicación de técnicas de Machine Learning para el estudio de deserción temprana y egreso oportuno en estudiantes de ingeniería de la facultad de ciencias físicas y matemáticas.” Accessed: Feb. 25, 2023. [Online]. Available: https://repositorio.uchile.cl/bitstream/handle/2250/178598/Aplicacion-de-tecnicas-de-Machine-Learning-para-el-estudio-de-desercion-temprana-y-egreso-oportuno-en-estudiantes-de-Ingenieria-de-la-Facultad-de-Ciencias%20Fisicas-y-Matematicas.pdf?sequence=1&isAllowed=y[15] A. Jose and C. Garcia, “Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos,” pp. 1–121, 2020.[16] H. Y. Ayala Yaguara, M. Valenzuela Sabogal, and A. Espinosa García, “Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca.” Accessed: Feb. 25, 2023. [Online]. Available: https://journal.universidadean.edu.co/index.php/Revistao/article/view/2676/2087[17] V. De La Cruz, “Diseño de un modelo predictivo basado en Machine Learning para el control de la deserción de estudiantes en la Universidad Ricardo Palma,” 2019.[18] M. L. Avila Pérez, “Modelo De Predicción De Deserción Estudiantil, Apoyado En Tecnologías De Data Mining, En Un Curso De Primera Matrícula De La Escuela ECBTI De La UNAD,” pp. 1–151, 2021.[19] J. D. T. D. F. T. Diofanor Acevedo, “Análisis de la Deserción Estudiantil en el Programa Ingeniería de Alimentos de la Universidad de Cartagena durante el Periodo Académico 2009 - 2013,” Cartagena, 2015.[20] Antonio Berlanga, “El camino desde la Inteligencia Artificial al Big Data.”[21] “Minería de datos: Qué es y por qué es importante | SAS.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.sas.com/es_co/insights/analytics/data-mining.html[22] D. S. G. César Pérez López, Minería de datos. Técnicas y herramientas, vol. 1. 2007.[23] E. M. Rojas, “Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo,” 2020.[24] “‘Machine Learning’: definición, tipos y aplicaciones prácticas - Iberdrola.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico[25] Wiley, Fundamentals and Methods of Machine and Deep Learning, Algorithms, Tools, and Applications. 2022.[26] Sandra Navarro, “KeepCoding Bootcamps.” Accessed: May 12, 2024. [Online]. Available: https://keepcoding.io/blog/que-es-gridsearchcv/[27] “sklearn.model_selection.GridSearchCV — scikit-learn 1.4.2 documentation.” Accessed: May 19, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html[28] J. Carlos González Sánchez and M. Javier Peñaloza Pérez, “Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en machine learning.,” 2021.[29] “Conceptos básicos de ayuda de CRISP-DM - Documentación de IBM.” Accessed: Feb. 08, 2024. [Online]. Available: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview[30] IBM, “¿Qué es un bosque aleatorio? | IBM.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.ibm.com/mx-es/topics/random-forest[31] “sklearn.ensemble.RandomForestClassifier — scikit-learn 1.4.2 documentation.” Accessed: May 18, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html[32] L. G. Díaz Monroy and M. A. Morales Rivera, Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Facultrad de Ciencias, Departamento de Estadística, 2009.[33] “Prueba de ji cuadrado de bondad de ajuste | Introducción a la estadística | JMP.” Accessed: May 04, 2024. [Online]. Available: https://www.jmp.com/es_co/statistics-knowledge-portal/chi-square-test/chi-square-goodness-of-fit-test.html[34] “La matriz de confusión y sus métricas – Inteligencia Artificial –.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/PublicationORIGINAL2024_Trabajo_Grado.pdf2024_Trabajo_Grado.pdfapplication/pdf1633773https://repository.ucc.edu.co/bitstreams/e91d7000-5f77-4a88-873f-2b9b0d5aeb97/download985b07be81e42e74311740ff9181781bMD572024_Licencia_Uso.pdf2024_Licencia_Uso.pdfapplication/pdf221089https://repository.ucc.edu.co/bitstreams/d8dfef58-98eb-4fe8-a290-4b8c675b97b1/download507a5da5578083e4c22db331d70d27adMD56CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repository.ucc.edu.co/bitstreams/bbefac87-21eb-4416-bc74-8283729f3721/download4460e5956bc1d1639be9ae6146a50347MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-84334https://repository.ucc.edu.co/bitstreams/f8a4ff56-103e-4bde-bb15-21aad6d89e65/download3bce4f7ab09dfc588f126e1e36e98a45MD55TEXT2024_Trabajo_Grado.pdf.txt2024_Trabajo_Grado.pdf.txtExtracted texttext/plain102036https://repository.ucc.edu.co/bitstreams/4d968cae-a239-4f4a-8bd8-4d60be5ebe1a/downloadd1212ade6f89d57728bc133cdb7d0eacMD5102024_Licencia_Uso.pdf.txt2024_Licencia_Uso.pdf.txtExtracted texttext/plain5884https://repository.ucc.edu.co/bitstreams/54c01867-069d-4d21-84fa-d0737a5a5ca2/download944f5016906a3ba7cf7854471b598314MD58THUMBNAIL2024_Trabajo_Grado.pdf.jpg2024_Trabajo_Grado.pdf.jpgGenerated Thumbnailimage/jpeg6680https://repository.ucc.edu.co/bitstreams/128d0d82-bc57-451c-be99-7c9ccb2dfa3f/download44ddecca48406bceb2432bd9618efabeMD5112024_Licencia_Uso.pdf.jpg2024_Licencia_Uso.pdf.jpgGenerated Thumbnailimage/jpeg12267https://repository.ucc.edu.co/bitstreams/e55ac4f0-c53e-4f42-b16c-baa9938d884d/download540ee1824142dfed4163ee9121349109MD5920.500.12494/56199oai:repository.ucc.edu.co:20.500.12494/561992024-08-21 18:09:26.078https://creativecommons.org/licenses/by-nc-nd/4.0/Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)open.accesshttps://repository.ucc.edu.coRepositorio Institucional Universidad Cooperativa de Colombiabdigital@metabiblioteca.comVU5JVkVSU0lEQUQgQ09PUEVSQVRJVkEgREUgQ09MT01CSUEKUkVQT1NJVE9SSU9TIElOU1RJVFVDSU9OQUxFUwpMSUNFTkNJQSBERSBVU08KClBvciBtZWRpbyBkZWwgcHJlc2VudGUgZG9jdW1lbnRvLCBlbCBBdXRvcihlcyksIG1heW9yIChlcykgZGUgZWRhZCwgcXVpZW4gZW4gYWRlbGFudGUgc2UgZGVub21pbmFyw6EgZWwgQVVUT1IsIGNvbmZpZXJlIGEgbGEgVU5JVkVSU0lEQUQgQ09PUEVSQVRJVkEgREUgQ09MT01CSUEsIGNvbiBOSVQuIDg2MC0wMjk5MjQtNywgdW5hIExJQ0VOQ0lBIERFIFVTTyBkZSBvYnJhLCBiYWpvIGxhcyBzaWd1aWVudGVzIGNvbmRpY2lvbmVzLgoKQ0zDgVVTVUxBUwoKUFJJTUVSQS4gT2JqZXRvLiBFTCBBVVRPUiBwb3IgZXN0ZSBhY3RvIGF1dG9yaXphIGxhIHV0aWxpemFjacOzbiBkZSBsYSBvYnJhLCBkZSBjb25mb3JtaWRhZCBjb24gbG8gZXN0aXB1bGFkbyBhIGNvbnRpbnVhY2nDs246IAoKKGEpIFBhcmEgZWZlY3RvcyBkZSBsYSBwcmVzZW50ZSBsaWNlbmNpYSBzZSBhdXRvcml6YSBsYSByZXByb2R1Y2Npw7NuIGRlIGxhIG9icmEgYW50ZXJpb3JtZW50ZSBjaXRhZGEsIGxhIGN1YWwgc2UgYWxvamFyw6EgZW4gZm9ybWF0byBkaWdpdGFsIGVuIGxhcyBwbGF0YWZvcm1hcyBvIHJlcG9zaXRvcmlvcyBhZG1pbmlzdHJhZG9zIHBvciBsYSBVTklWRVJTSURBRCBvIGVuIG90cm8gdGlwbyBkZSByZXBvc2l0b3Jpb3MgZXh0ZXJub3MgbyBww6FnaW5hcyB3ZWIgZXNjb2dpZG9zIHBvciBsYSBVTklWRVJTSURBRCwgcGFyYSBmaW5lcyBkZSBkaWZ1c2nDs24geSBkaXZ1bGdhY2nDs24uIEFkaWNpb25hbG1lbnRlLCBzZSBhdXRvcml6YSBhIHF1ZSBsb3MgdXN1YXJpb3MgaW50ZXJub3MgeSBleHRlcm5vcyBkZSBkaWNoYXMgcGxhdGFmb3JtYXMgbyByZXBvc2l0b3Jpb3MgcmVwcm9kdXpjYW4gbyBkZXNjYXJndWVuIGxhIG9icmEsIHNpbiDDoW5pbW8gZGUgbHVjcm8sIHBhcmEgZmluZXMgcHJpdmFkb3MsIGVkdWNhdGl2b3MgbyBhY2Fkw6ltaWNvczsgc2llbXByZSB5IGN1YW5kbyBubyBzZSB2aW9sZW4gYWN1ZXJkb3MgY29uIGVkaXRvcmVzLCBwZXJpb2RvcyBkZSBlbWJhcmdvIG8gYWN1ZXJkb3MgZGUgY29uZmlkZW5jaWFsaWRhZCBxdWUgYXBsaXF1ZW4uCgooYikgU2UgYXV0b3JpemEgbGEgY29tdW5pY2FjacOzbiBww7pibGljYSB5IGxhIHB1ZXN0YSBhIGRpc3Bvc2ljacOzbiBkZSBsYSBvYnJhIG1lbmNpb25hZGEsIGVuIGFjY2VzbyBhYmllcnRvLCBwYXJhIHN1IHV0aWxpemFjacOzbiBlbiBsYXMgcGxhdGFmb3JtYXMgbyByZXBvc2l0b3Jpb3MgYWRtaW5pc3RyYWRvcyBwb3IgbGEgVU5JVkVSU0lEQUQuCgooYykgTG8gYW50ZXJpb3IgZXN0YXLDoSBzdWpldG8gYSBsYXMgZGVmaW5pY2lvbmVzIGNvbnRlbmlkYXMgZW4gbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MyB5IGxhIExleSAyMyBkZSAxOTgyLgoKClNFR1VOREEuIE9yaWdpbmFsaWRhZCB5IHJlY2xhbWFjaW9uZXMuIEVsIEFVVE9SIGRlY2xhcmEgcXVlIGxhIE9CUkEgZXMgb3JpZ2luYWwgeSBxdWUgZXMgZGUgc3UgY3JlYWNpw7NuIGV4Y2x1c2l2YSwgbm8gZXhpc3RpZW5kbyBpbXBlZGltZW50byBkZSBjdWFscXVpZXIgbmF0dXJhbGV6YSAoZW1iYXJnb3MsIHVzbyBkZSBtYXRlcmlhbCBwcm90ZWdpZG8gcG9yIGRlcmVjaG9zIGRlIGF1dG9yKSBwYXJhIGxhIGNvbmNlc2nDs24gZGUgbG9zIGRlcmVjaG9zIHByZXZpc3RvcyBlbiBlc3RlIGFjdWVyZG8uIEVsIEFVVE9SIHJlc3BvbmRlcsOhIHBvciBjdWFscXVpZXIgYWNjacOzbiBkZSByZWl2aW5kaWNhY2nDs24sIHBsYWdpbyB1IG90cmEgY2xhc2UgZGUgcmVjbGFtYWNpw7NuIHF1ZSBhbCByZXNwZWN0byBwdWRpZXJhIHNvYnJldmVuaXIuCgpURVJDRVJBLiBDb250cmFwcmVzdGFjacOzbi4gRWwgQVVUT1IgYXV0b3JpemEgYSBxdWUgc3Ugb2JyYSBzZWEgdXRpbGl6YWRhIGRlIGNvbmZvcm1pZGFkIGNvbiBsYSBjbMOhdXN1bGEgUFJJTUVSQSBkZSBmb3JtYSBncmF0dWl0YSwgZXMgZGVjaXIsIHF1ZSBsYSB1dGlsaXphY2nDs24gZGUgbGEgbWlzbWEgbm8gZ2VuZXJhIG5pbmfDum4gcGFnbyBvIHJlZ2Fsw61hcyBlbiBmYXZvciBkZSBlc3RlLgoKQ1VBUlRBLiBUaXR1bGFyaWRhZCBkZSBkZXJlY2hvcy4gRWwgcHJlc2VudGUgY29udHJhdG8gbm8gdHJhbnNmaWVyZSBsYSB0aXR1bGFyaWRhZCBkZSBsb3MgZGVyZWNob3MgcGF0cmltb25pYWxlcyBzb2JyZSBsYXMgb2JyYXMgYW50ZXJpb3JtZW50ZSBtZW5jaW9uYWRhcyBhIGxhIFVOSVZFUlNJREFELiDDmm5pY2FtZW50ZSBoYWNlIHJlbGFjacOzbiBhIHVuYSBsaWNlbmNpYSBubyBleGNsdXNpdmEgZW4gbG9zIHTDqXJtaW5vcyB5IGNvbmRpY2lvbmVzIGFudGVyaW9ybWVudGUgcGFjdGFkb3MuCgpRVUlOVEEuIENyw6lkaXRvcy4gTGEgVU5JVkVSU0lEQUQgc2UgY29tcHJvbWV0ZSBhIGRhciBhbCBBVVRPUiwgZWwgcmVjb25vY2ltaWVudG8gZGVudHJvIGNhZGEgZm9ybWEgZGUgdXRpbGl6YWNpw7NuIGVuIGxhIG9icmEuIExvcyBjcsOpZGl0b3MgZGViZW4gZmlndXJhciBlbiBjYWRhIHVubyBkZSBsb3MgZm9ybWF0b3MgbyByZWdpc3Ryb3MgZGUgcHVibGljYWNpw7NuLiBObyBjb25zdGl0dWlyw6EgdW5hIHZpb2xhY2nDs24gYSBsb3MgZGVyZWNob3MgbW9yYWxlcyBkZWwgYXV0b3IgbGEgbm8gcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBvIGRlbcOhcyB1dGlsaXphY2lvbmVzIGRlIGxhIG9icmEuIExhIHV0aWxpemFjacOzbiBvIG5vIGRlIGxhIG9icmEsIGFzw60gY29tbyBzdSBmb3JtYSBkZSB1dGlsaXphY2nDs24gc2Vyw6EgZmFjdWx0YWQgZXhjbHVzaXZhIGRlIGxhIFVOSVZFUlNJREFELgogClNFWFRBLiBEdXJhY2nDs24geSB0ZXJyaXRvcmlvLiBMYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28gcXVlIHNlIG90b3JnYSBhIGZhdm9yIGRlIGxhIFVOSVZFUlNJREFEIHRlbmRyw6EgdW5hIGR1cmFjacOzbiBlcXVpdmFsZW50ZSBhbCB0w6lybWlubyBkZSBwcm90ZWNjacOzbiBsZWdhbCBkZSBsYSBvYnJhIHkgcGFyYSB0b2RvcyBsb3MgcGHDrXNlcyBkZWwgbXVuZG8uCgpTw4lQVElNQS4gVXNvIGRlIENyZWF0aXZlIENvbW1vbnMuIEVsIEFVVE9SIGF1dG9yaXphcsOhIGxhIGRpZnVzacOzbiBkZSBzdSBjb250ZW5pZG8gYmFqbyB1bmEgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBhdHJpYnVjacOzbiA0LjAgaW50ZXJuYWNpb25hbCwgcXVlIGRlYmVyw6EgaW5jbHVpcnNlIGVuIGVsIGNvbnRlbmlkby4gCgpPQ1RBVkEuIERlcmVjaG8gZGUgZXhjbHVzacOzbi4gQ2FkYSBhdXRvciBwdWVkZSBpbmRpY2FyIGVuIGVsIG1vbWVudG8gZGUgZGVww7NzaXRvIGRlbCBjb250ZW5pZG8gcXVlIGVsIHRleHRvIGNvbXBsZXRvIGRlIGxhIHByb2R1Y2Npw7NuIGFjYWTDqW1pY2EgbyBjaWVudMOtZmljYSBubyBlc3RlIGNvbiBhY2Nlc28gYWJpZXJ0byBlbiBlbCBSZXBvc2l0b3JpbyBJbnN0aXR1Y2lvbmFsIHBvciBtb3Rpdm9zIGRlIGNvbmZpZGVuY2lhbGlkYWQsIHBvcnF1ZSBzZSBlbmN1ZW50cmUgZW4gdsOtYXMgZGUgb2J0ZW5lciB1biBkZXJlY2hvIGRlIHByb3BpZWRhZCBpbmR1c3RyaWFsIG8gZXhpc3RpciBhY3VlcmRvcyBwcmV2aW9zIGNvbiB0ZXJjZXJvcyAoZWRpdG9yaWFsZXMsIHJldmlzdGFzIGNpZW50w61maWNhcywgb3RyYXMgaW5zdGl0dWNpb25lcykuIEVsIGF1dG9yIHNlIGNvbXByb21ldGUgYSBkZXBvc2l0YXIgbG9zIG1ldGFkYXRvcyBlIGluZm9ybWFyIGVsIHRpZW1wbyBkZSBlbWJhcmdvIGR1cmFudGUgZWwgY3VhbCBlbCB0ZXh0byBjb21wbGV0byB0ZW5kcsOhIGFjY2VzbyByZXN0cmluZ2lkby4gCgpOT1ZFTkEuIEVsIEFVVE9SIGFsIGFjZXB0YXIgZXN0YSBsaWNlbmNpYSBhZHVjZSBxdWUgZXN0YSBwcm9kdWNjacOzbiBzZSBkZXNhcnJvbGzDsyBlbiBlbCBwZXJpb2RvIGVuIHF1ZSBzZSBlbmN1ZW50cmEgY29uIHbDrW5jdWxvcyBjb24gTGEgVW5pdmVyc2lkYWQuCgpEw4lDSU1BLiBOb3JtYXMgYXBsaWNhYmxlcy4gUGFyYSBsYSBpbnRlcnByZXRhY2nDs24geSBjdW1wbGltaWVudG8gZGVsIHByZXNlbnRlIGFjdWVyZG8gbGFzIHBhcnRlcyBzZSBzb21ldGVuIGEgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgbGEgTGV5IDIzIGRlIDE5ODIgeSBkZW3DoXMgbm9ybWFzIGFwbGljYWJsZXMgZGUgQ29sb21iaWEuIEFkZW3DoXMsIGEgbGFzIG5vcm1hcyBJbnN0aXR1Y2lvbmFsZXMgcXVlIGFwbGlxdWVuLgoKTGEgcHJlc2VudGUgbGljZW5jaWEgc2UgYXV0b3JpemEgZW4gbGEgZmVjaGEgZGUgcHVibGljYWNpw7NuIGVuIGxvcyByZXBvc2l0b3Jpb3MgaW5zdGl0dWNpb25hbGVzLgo= |