Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre
El proyecto “MEJORAR EL MODELO DE ESTIMACIÓN DE RIESGO DE DESERCIÓN DE LOS ESTUDIANTES DE PREGRADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA EMPLEANDO HERRAMIENTAS BUSINESS INTELLIGENCE SOPORTADAS EN SOFTWARE LIBRE” creado por Miguel Eduardo Ropero Silva para obtener el título de Magister en SOFTWAR...
- Autores:
-
Ropero Silva, Miguel Eduardo
- Tipo de recurso:
- Fecha de publicación:
- 2018
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/3439
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/3439
- Palabra clave:
- Universidad Autónoma de Bucaramanga UNAB
Systems Engineering
Free software
Data Mining
Computer program
Algorithms
Free software
University dropout
Technical aspects
Investigations
Analysis
Academic desertion
Decision trees
Classification techniques
Ingeniería de sistemas
Software libre
Data Mining
Programa para computador
Algoritmos
Software libre
Deserción universitaria
Aspectos técnicos
Investigaciones
Análisis
Deserción académica
Minería de datos
Arboles de decisión
Técnicas de clasificación
Algoritmo J48
Weka
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_307446fca73a9c787550b1da11ce6d65 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/3439 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
dc.title.translated.eng.fl_str_mv |
IMPROVE THE RISK ESTIMATION MODEL OF UNDERGRADUATE STUDENTS OF THE UNIVERSITY AUTÓNOMA DE BUCARAMANGA USING BUSINESS INTELLIGENCE TOOLS SUPPORTED IN FREE SOFTWARE |
title |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
spellingShingle |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre Universidad Autónoma de Bucaramanga UNAB Systems Engineering Free software Data Mining Computer program Algorithms Free software University dropout Technical aspects Investigations Analysis Academic desertion Decision trees Classification techniques Ingeniería de sistemas Software libre Data Mining Programa para computador Algoritmos Software libre Deserción universitaria Aspectos técnicos Investigaciones Análisis Deserción académica Minería de datos Arboles de decisión Técnicas de clasificación Algoritmo J48 Weka |
title_short |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
title_full |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
title_fullStr |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
title_full_unstemmed |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
title_sort |
Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libre |
dc.creator.fl_str_mv |
Ropero Silva, Miguel Eduardo |
dc.contributor.advisor.spa.fl_str_mv |
Cuello De Avila, Silvio Rafael |
dc.contributor.author.spa.fl_str_mv |
Ropero Silva, Miguel Eduardo |
dc.contributor.googlescholar.none.fl_str_mv |
Cuello De Avila, Silvio Rafael [0g-Gf7AAAAAJ] |
dc.subject.none.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
topic |
Universidad Autónoma de Bucaramanga UNAB Systems Engineering Free software Data Mining Computer program Algorithms Free software University dropout Technical aspects Investigations Analysis Academic desertion Decision trees Classification techniques Ingeniería de sistemas Software libre Data Mining Programa para computador Algoritmos Software libre Deserción universitaria Aspectos técnicos Investigaciones Análisis Deserción académica Minería de datos Arboles de decisión Técnicas de clasificación Algoritmo J48 Weka |
dc.subject.keywords.eng.fl_str_mv |
Systems Engineering Free software Data Mining Computer program Algorithms Free software University dropout Technical aspects Investigations Analysis Academic desertion Decision trees Classification techniques |
dc.subject.lemb.spa.fl_str_mv |
Ingeniería de sistemas Software libre Data Mining Programa para computador Algoritmos Software libre Deserción universitaria Aspectos técnicos Investigaciones Análisis |
dc.subject.proposal.spa.fl_str_mv |
Deserción académica Minería de datos Arboles de decisión Técnicas de clasificación Algoritmo J48 Weka |
description |
El proyecto “MEJORAR EL MODELO DE ESTIMACIÓN DE RIESGO DE DESERCIÓN DE LOS ESTUDIANTES DE PREGRADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA EMPLEANDO HERRAMIENTAS BUSINESS INTELLIGENCE SOPORTADAS EN SOFTWARE LIBRE” creado por Miguel Eduardo Ropero Silva para obtener el título de Magister en SOFTWARE LIBRE, y dirigido por el Ingeniero Silvio Rafael Cuello de Ávila. presenta los resultados de la aplicación de técnicas de minería de datos para la predicción de la deserción académica con el uso del software de distribución libre Weka y el algoritmo de clasificación de árboles de decisión J48. En la investigación se obtuvieron los datos académicos, financieros y psicológicos de los estudiantes de primer ingreso en los programas de pregrado de los periodos 2014-02, 2015-01, 2015-02 y 2016-01, los cuales, fueron analizados, modelados y evaluados a través de la metodología de minería de datos CRISP-DM. Los registros obtenidos también fueron evaluados a través del modelo matemático (empírico) de deserción desarrollado por la UNAB. Los resultados de deserción del modelo de minería de datos y del modelo empírico, fueron cruzados contra los resultados reales de deserción en los periodos evaluados para determinar cuál de ellos ofrecía un mayor porcentaje de precisión. Finalmente, fueron identificadas las principales variables involucradas en la deserción de un estudiante de acuerdo a la información previamente analizada. |
publishDate |
2018 |
dc.date.issued.none.fl_str_mv |
2018 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T21:34:48Z |
dc.date.available.none.fl_str_mv |
2020-06-26T21:34:48Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.local.spa.fl_str_mv |
Tesis |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/3439 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/3439 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Ropero Silva, Miguel Eduardo (2018). Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas bussines intelligence soportadas en software libre. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOC Amaya, Y. y Barrientos, E. y Heredia, D. (2015). Student dropout predictive model using data mining techniques. IEEE Latin America Transactions, vol. (13). Azoumana, K. (2013). Análisis de la deserción estudiantil en la Universidad Simón Bolívar, facultad Ingeniería de Sistemas, con técnicas de minería de datos. Pensamiento Americano, 41-5 Bouckaert, R. (2010). WEKA---Experiences with a java open-source project. The Journal of Machine Learning Research, vol. (11), pp. 2533-2541. Recuperado de http://dl.acm.org/citation.cfm?id=1953016 Cabena, P. (1998). Discovering Data mining From Concept To Implementation. Estados Unidos: Prentice Hall Castellanos Guarín, L. (2015). Incorporación de Elementos de Inteligencia de Negocios al Análisis de Deserción Estudiantil de la universidad Autónoma de Bucaramanga (Tesis de Maestría). Universidad Autónoma de Bucaramanga, Colombia. Chapman, P. y Clinton, J. y Kerber, R. y Khabaza, T. y Reinartz, T. y Shearer, C. y Wirth, R. (2000). CRISP-DM 1.0. Recuperado de ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf Demšar, J. (2016). Orange: Data mining toolbox in python. The Journal of Machine Learning Research, vol. (14), pp. 2349-2353. Recuperado de http://dl.acm.org/citation.cfm?id=2567736&CFID=789665709&CFTOKEN=93305719 Departamento Nacional de Planeación. (2016). Visión Colombia II Centenario. Recuperado de http://www.mineducacion.gov.co/cvn/1665/article-95980.html Ekkachai, N. Jatsada, S. Nittaya, K. (2012). Classification Model Induction For Student Recruiting, Latest Advances In Educational Technologies. Recuperado de http://www.wseas.us/e-library/conferences/2012/Singapore/EDUC/EDUC-18.pdf Fayyad, U. y Piatetsky-Shapiro, G. y Smyth, P. (1996). From data mining to knowledge discovery: an overview. AI Magazine, vol. (17), pp. 37-54. Recuperado de https://www.aaai.org/ojs/index.php/aimagazine/article/viewFile/1230/1131 Han, J. y Kamber, M. y Pei, J. (2001). Data mining: Concepts and techniques. Amsterdam: Morgan Kaufmann Publishers. Hernández Orallo, J. y Ramírez Quintana, M. y Ferri Ramírez, C. (2004). Introducción a la Minería de Datos. Pearson Educación Howson, C. (2007). Successful business intelligence: Secrets to making bi a killer App. Estados Unidos: McGraw-Hill Education International Educational Data Mining Society. (s.f.). Educational Data Mining. Recuperado el 10 de abril de 2016 de http://educationaldatamining.org Kumar, S. y Pal, S. (2012). Data mining: A prediction for performance improvement of engineering students using classification. World of Computer Science and Information Technology Journal, vol. (2), pp. 51-56. The University Of Waikato (s.f.). Weka 3 - data mining with open source machine learning software in java. Recuperado de http://www.cs.waikato.ac.nz/ml/weka/ Ministerio de Educación Nacional. (2010). Deserción estudiantil en la educación superior colombiana. Recuperado el 15 abril de 2016 de http://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdf Ministerio de Educación Nacional. (2015a). Estrategias Para la Permanencia en Educación Superior: Experiencias Significativas. Recuperado de http://www.colombiaaprende.edu.co/html/micrositios/1752/articles-350844_pdf.pdf. Ministerio de Educación Nacional (2015b). Guía para la implementación del modelo de gestión de permanencia y graduación estudiantil en instituciones de educación superior. Recuperado de http://www.colombiaaprende.edu.co/html/micrositios/1752/articles-355193_guia_.pdf Ministerio de Educación Nacional (2016). Estadísticas de deserción y graduación 2015. Recuperado de http://www.colombiaaprende.edu.co/html/ micrositios/1752/articles-350629_estadisticas_pdf2015.pdf Moine, J. y Haedo, A. y Gordillo, S. (2001). Estudio comparativo de metodologías para minería de datos. XIII Workshop de Investigadores en Ciencias de la Computación. Recuperado de http://sedici.unlp.edu.ar/handle/10915/20034 Muenchen, B. (2017). The Popularity of Data Science Software. Recuperado de http://r4stats.com/articles/popularity Oracle Help Center (2016). Data Warehousing and Business Intelligence. Recuperado de https://docs.oracle.com/cd/B28359_01/datamine.111/ b28129/regress.htm Parr Rud, O. (2000). Data mining cookbook: Modeling data for marketing, risk, and customer relationship management. United States: Wiley, John & Sons. Rangra, K. (2014). Comparative study of data mining tools. International Journal of Advanced Research in Computer Science and Software Engineering, vol. (04), pp. 6 Remco, R. Eibe, F. (2016). Weka Manual for Version 3-8-1. Recuperado de http://www.cs.waikato.ac.nz/ml/weka/documentation.html Rohanizadeh, S. y Moghadam, M. (2010). A proposed data mining methodology and its application to industrial procedures. Journal of Industrial Engineering, vol. (4), pp. 37-50 Sauter, V. (2011). Decision support systems for business intelligence. New Jersey, Estados Unidos: United Kingdom: Wiley-Blackwell. Society for Learning Analytics Research – SoLAR. (2014). About SOLAR. Recuperado el 10 de abril de 2016 de http://educationaldatamining.org/ Statistical Analysis System - SAS Institute Inc (2003). Data Mining Using SAS Enterprise Miner: A Case Study Approach. Recuperado de http://support.sas.com/documentation/onlinedoc/miner/casestudy_59123.pdf Timaran Pereira, R. (2009). Una lectura sobre deserción universitaria en estudiantes de pregrado desde la perspectiva de la Minería de Datos. Recuperado el 20 de mayo de 2016 de http://www.redalyc.org/html/1053/105317327011/ Turban, E. y Sharda, R. y Denle, D. y King, D. (2013). Business intelligence: A managerial perspective on Analytics. Boston, Estados Unidos: Prentice Hall Universidad Autónoma de Bucaramanga (2016a). Acerca de la UNAB. Recuperado de http://unab.edu.co/nosotros/acerca-de Universidad Autónoma de Bucaramanga (2016b). Bienestar Universitario. Recuperado de http://unab.edu.co/nosotros/bienestar-universitario University of Ljubljana (2016). License Orange. Recuperado de http://orange.biolab.si/license/ Valenzuela, J. Flores, M. (2014). Fundamentos de Investigación Educativa. Ciudad de México, México: Editorial digital del tecnológico de Monterrey. Vercellis, C. (2011). Business intelligence: Data mining and optimization for decision making. United States: Wiley, John & Sons. Witten, I. y Frank, E. y Hall, M. (2005). Data mining: Practical machine learning tools and techniques. San Francisco, CA: Morgan Kaufmann Publishers. |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.spatial.spa.fl_str_mv |
Bucaramanga (Santander, Colombia) |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Maestría en Software Libre |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/3439/1/2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3439/2/2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3439/3/Anexos.zip https://repository.unab.edu.co/bitstream/20.500.12749/3439/4/2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3439/5/2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf.jpg https://repository.unab.edu.co/bitstream/20.500.12749/3439/6/2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf.jpg https://repository.unab.edu.co/bitstream/20.500.12749/3439/7/2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf.jpg |
bitstream.checksum.fl_str_mv |
757bb90081847754eb571eab793d71dc 4ddc32607dbd7d555f27d9113d8d034a 3b49497dfc2feedd5a7f5fe90f4ab330 27863d640d0e7a1565b3734ec1d524f7 8226cba678852b0147e6024ac0256aa0 c1129837591e9f683a6a1e8dc1d52fc0 5566d93e17a3b63e4d22047e3fc7279f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277320165294080 |
spelling |
Cuello De Avila, Silvio RafaelRopero Silva, Miguel EduardoCuello De Avila, Silvio Rafael [0g-Gf7AAAAAJ]Bucaramanga (Santander, Colombia)Bucaramanga (Colombia)2020-06-26T21:34:48Z2020-06-26T21:34:48Z2018http://hdl.handle.net/20.500.12749/3439instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEl proyecto “MEJORAR EL MODELO DE ESTIMACIÓN DE RIESGO DE DESERCIÓN DE LOS ESTUDIANTES DE PREGRADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA EMPLEANDO HERRAMIENTAS BUSINESS INTELLIGENCE SOPORTADAS EN SOFTWARE LIBRE” creado por Miguel Eduardo Ropero Silva para obtener el título de Magister en SOFTWARE LIBRE, y dirigido por el Ingeniero Silvio Rafael Cuello de Ávila. presenta los resultados de la aplicación de técnicas de minería de datos para la predicción de la deserción académica con el uso del software de distribución libre Weka y el algoritmo de clasificación de árboles de decisión J48. En la investigación se obtuvieron los datos académicos, financieros y psicológicos de los estudiantes de primer ingreso en los programas de pregrado de los periodos 2014-02, 2015-01, 2015-02 y 2016-01, los cuales, fueron analizados, modelados y evaluados a través de la metodología de minería de datos CRISP-DM. Los registros obtenidos también fueron evaluados a través del modelo matemático (empírico) de deserción desarrollado por la UNAB. Los resultados de deserción del modelo de minería de datos y del modelo empírico, fueron cruzados contra los resultados reales de deserción en los periodos evaluados para determinar cuál de ellos ofrecía un mayor porcentaje de precisión. Finalmente, fueron identificadas las principales variables involucradas en la deserción de un estudiante de acuerdo a la información previamente analizada.Universitat Oberta de Catalunya UOCINTRODUCCIÓN 1. PLANTEAMIENTO DEL PROBLEMA ...................................................... 18 2. JUSTIFICACIÓN ...................................................................................... 21 3.OBJETIVOS .............................................................................................. 23 3.1. OBJETIVO GENERAL .......................................................................... 23 3.2. OBJETIVOS ESPECÍFICOS ................................................................ 23 4. RESULTADOS ESPERADOS ...........................................................…... 24 5. ANTECEDENTES .................................................................................... 25 6. MARCO TEÓRICO .................................................................................. 39 6.1 DESERCIÓN EN LA EDUCACIÓN SUPERIOR ..................................... 39 6.2 BUSINESS INTELLIGENCE (BI) …........................................................ 42 6.3. DATA MINING ........................................................................................ 43 6.4. METODOLOGÍAS DE MINERÍA DE DATOS ………………………….... 46 6.4.1 Metodología CRISP-DM ...................................................................... 47 6.4.2 Metodología SEMMA ........................................................................... 49 6.4.3 Proceso KDD - Knowledge Discovery in Databases ............................ 50 6.5 MODELOS DE MINERÍA DE DATOS ….................................................. 52 6.5.1 Modelo Descriptivo .............................................................................. 52 6.5.2 Modelo Predictivo ................................................................................ 53 6.6 MÉTODOS DE MINERÍA DE DATOS ..................................................... 53 6.6.1 Método de Clasificación ....................................................................... 53 6.6.2 Método de Regresión .......................................................................... 54 6.6.3 Método de Agrupamiento (Clustering) ................................................. 54 6.6.4 Método de Asociación ......................................................................... 55 6.7 TÉCNICAS DE MINERÍA DE DATOS ….................................................. 55 6.7.1 Arboles de Decisión ............................................................................. 55 6.7.2 Redes Neuronales Artificiales .............................................................. 56 6.7.3 Clasificadores bayesianos ................................................................... 57 6.7.4 Reglas de Clasificación ....................................................................... 58 6.7.5 Regresión Lineal ................................................................................. 58 6.7.6 Reglas de Asociación .......................................................................... 59 6.7.7 K-Vecinos ............................................................................................ 59 6.7.8 K-Medias ............................................................................................. 60 6.8 HERRAMIENTAS SOFTWARE PARA LA MINERÍA DE DATOS .......….. 61 6.8.1 Weka ................................................................................................... 61 6.8.2 RapidMiner .......................................................................................... 62 6.8.3 Orange ................................................................................................ 63 7. MARCO METODOLÓGICO ..................................................................... 64 7.1 METODOLOGÍAS IMPLEMENTADAS ................................................... 64 7.2 HIPÓTESIS ……………………............................................................... 65 7.3 POBLACIÓN Y MUESTRA ..................................................................... 65 7.4 RECOLECCIÓN DE LA INFORMACIÓN ................................................ 66 7.5 PLAN DE INVESTIGACIÓN ………........................................................ 66 7.5.1 Aplicación de la Metodología CRIPS-DM ............................................. 67 7.5.2 Descripción de los mecanismos de análisis de Datos .......................... 68 8. RESULTADOS ……………………………..…………………………………. 71 8.1 SOFTWARE DE MINERÍA DE DATOS ……………………………........... 71 8.2 ALGORITMO DE CLASIFICACIÓN …..…………………………….......... 72 8.3 INTRODUCCIÓN A WEKA ………………………………………............... 73 8.3.1 Instalación ………………….……………………………......................... 73 8.3.2 Interfaz de Preprocesamiento ………………………….......................... 75 8.3.3 Pestaña de Clasificación ….……………………………......................... 77 8.3.4 Resultados Weka ………….……………………………......................... 80 8.4 CONOCIMIENTO DEL NEGOCIO …….....……………………………….. 80 8.5 COMPRENSIÓN DE LOS DATOS …..…………………………………….. 81 8.6 PREPARACIÓN DE LOS DATOS ……..…………………………………... 89 8.7 MODELADO DE LOS DATOS ………..……………………………………. 90 8.8 ANÁLISIS GENERAL DE LOS DATOS ………………………………….... 90 8.9 ANÁLISIS POR PERIODO ACADÉMICO ……………………………….... 92 8.9.1 Análisis Periodo 2014-02 ………………………………………………… 93 8.9.2 Análisis Periodo 2015-01 ………………………………………………… 99 8.9.3 Análisis Periodo 2015-02 ………………………………………………… 101 8.9.4 Análisis Periodo 2016-01 ………………………………………………… 104 8.10 ANÁLISIS POR PERIODO ACADÉMICO ACUMULADO …………....... 108 8.10.1 Periodos 2014-02 y 2015-01 ………………………………………….... 108 8.10.2 Periodos 2014-02, 2015-01 y 201502 …………………………………. 110 8.10.3 Periodos 2014-02, 2015-01, 201502 y 2016-01 ……………………… 113 8.11 ANÁLISIS POR PERIODO ACADÉMICO ACUMULADO SIN VARIABLE RENDIMIENTO ACADÉMICO ………….........................… 115 8.11.1 Periodos 2014-02 y 2015-01 ………………………………………….... 116 8.11.2 Periodos 2014-02, 2015-01 y 201502 …………………………………. 117 8.11.3 Periodos 2014-02, 2015-01, 201502 y 2016-01 ………………………. 119 8.12 ANÁLISIS DE RESULTADOS …………................................................ 122 8.12.1 Análisis de Variables Determinantes de Deserción ………………….. 128 8.12.2 Comparación del modelo BI contra el modelo empírico de la UNAB 129 9. CONCLUSIONES …………………………………………………………….. 133 10. RECOMENDACIONES Y TRABAJOS FUTUROS ……………………... 135 BIBLIOGRAFÍA 136 ANEXOS 140MaestríaThe project "IMPROVE THE RISK ESTIMATION MODEL OF UNDERGRADUATE STUDENTS OF THE UNIVERSITY AUTÓNOMA DE BUCARAMANGA USING BUSINESS INTELLIGENCE TOOLS SUPPORTED IN FREE SOFTWARE" created by Miguel Eduardo Ropero Silva to obtain the title of Master in FREE SOFTWARE, and directed by Engineer Silvio Rafael Cuello de Ávila, presents the results of the application of data mining techniques for the prediction of academic desertion with the use of the free distribution software Weka and the classification algorithm of decision trees J48. In the research the academic, financial and psychological data of first-year students in the undergraduate programs of the periods 2014-02, 2015-01, 2015-02 and 2016-01 were obtained, which were analyzed, modeled and evaluated through the CRISP-DM data mining methodology. The records obtained were also evaluated through the mathematical model (empirical) of desertion developed by the UNAB. The desertion results of the data mining model and the empirical model were crossed against the actual results of desertion in the periods evaluated to determine which of them offered a greater percentage of accuracy. Finally, the main variables involved in the desertion of a student were identified according to the information previously analyzed.application/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaUniversidad Autónoma de Bucaramanga UNABSystems EngineeringFree softwareData MiningComputer programAlgorithmsFree softwareUniversity dropoutTechnical aspectsInvestigationsAnalysisAcademic desertionDecision treesClassification techniquesIngeniería de sistemasSoftware libreData MiningPrograma para computadorAlgoritmosSoftware libreDeserción universitariaAspectos técnicosInvestigacionesAnálisisDeserción académicaMinería de datosArboles de decisiónTécnicas de clasificaciónAlgoritmo J48WekaMejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas business intelligence soportadas en software libreIMPROVE THE RISK ESTIMATION MODEL OF UNDERGRADUATE STUDENTS OF THE UNIVERSITY AUTÓNOMA DE BUCARAMANGA USING BUSINESS INTELLIGENCE TOOLS SUPPORTED IN FREE SOFTWAREMagíster en Software LibreUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Software Libreinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMRopero Silva, Miguel Eduardo (2018). Mejorar el modelo de estimación de riesgo de deserción de los estudiantes de pregrado de la Universidad Autónoma de Bucaramanga empleando herramientas bussines intelligence soportadas en software libre. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOCAmaya, Y. y Barrientos, E. y Heredia, D. (2015). Student dropout predictive model using data mining techniques. IEEE Latin America Transactions, vol. (13).Azoumana, K. (2013). Análisis de la deserción estudiantil en la Universidad Simón Bolívar, facultad Ingeniería de Sistemas, con técnicas de minería de datos. Pensamiento Americano, 41-5Bouckaert, R. (2010). WEKA---Experiences with a java open-source project. The Journal of Machine Learning Research, vol. (11), pp. 2533-2541. Recuperado de http://dl.acm.org/citation.cfm?id=1953016Cabena, P. (1998). Discovering Data mining From Concept To Implementation. Estados Unidos: Prentice HallCastellanos Guarín, L. (2015). Incorporación de Elementos de Inteligencia de Negocios al Análisis de Deserción Estudiantil de la universidad Autónoma de Bucaramanga (Tesis de Maestría). Universidad Autónoma de Bucaramanga, Colombia.Chapman, P. y Clinton, J. y Kerber, R. y Khabaza, T. y Reinartz, T. y Shearer, C. y Wirth, R. (2000). CRISP-DM 1.0. Recuperado de ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdfDemšar, J. (2016). Orange: Data mining toolbox in python. The Journal of Machine Learning Research, vol. (14), pp. 2349-2353. Recuperado de http://dl.acm.org/citation.cfm?id=2567736&CFID=789665709&CFTOKEN=93305719Departamento Nacional de Planeación. (2016). Visión Colombia II Centenario. Recuperado de http://www.mineducacion.gov.co/cvn/1665/article-95980.htmlEkkachai, N. Jatsada, S. Nittaya, K. (2012). Classification Model Induction For Student Recruiting, Latest Advances In Educational Technologies. Recuperado de http://www.wseas.us/e-library/conferences/2012/Singapore/EDUC/EDUC-18.pdfFayyad, U. y Piatetsky-Shapiro, G. y Smyth, P. (1996). From data mining to knowledge discovery: an overview. AI Magazine, vol. (17), pp. 37-54. Recuperado de https://www.aaai.org/ojs/index.php/aimagazine/article/viewFile/1230/1131Han, J. y Kamber, M. y Pei, J. (2001). Data mining: Concepts and techniques. Amsterdam: Morgan Kaufmann Publishers.Hernández Orallo, J. y Ramírez Quintana, M. y Ferri Ramírez, C. (2004). Introducción a la Minería de Datos. Pearson EducaciónHowson, C. (2007). Successful business intelligence: Secrets to making bi a killer App. Estados Unidos: McGraw-Hill EducationInternational Educational Data Mining Society. (s.f.). Educational Data Mining. Recuperado el 10 de abril de 2016 de http://educationaldatamining.orgKumar, S. y Pal, S. (2012). Data mining: A prediction for performance improvement of engineering students using classification. World of Computer Science and Information Technology Journal, vol. (2), pp. 51-56.The University Of Waikato (s.f.). Weka 3 - data mining with open source machine learning software in java. Recuperado de http://www.cs.waikato.ac.nz/ml/weka/Ministerio de Educación Nacional. (2010). Deserción estudiantil en la educación superior colombiana. Recuperado el 15 abril de 2016 de http://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdfMinisterio de Educación Nacional. (2015a). Estrategias Para la Permanencia en Educación Superior: Experiencias Significativas. Recuperado de http://www.colombiaaprende.edu.co/html/micrositios/1752/articles-350844_pdf.pdf.Ministerio de Educación Nacional (2015b). Guía para la implementación del modelo de gestión de permanencia y graduación estudiantil en instituciones de educación superior. Recuperado de http://www.colombiaaprende.edu.co/html/micrositios/1752/articles-355193_guia_.pdfMinisterio de Educación Nacional (2016). Estadísticas de deserción y graduación 2015. Recuperado de http://www.colombiaaprende.edu.co/html/ micrositios/1752/articles-350629_estadisticas_pdf2015.pdfMoine, J. y Haedo, A. y Gordillo, S. (2001). Estudio comparativo de metodologías para minería de datos. XIII Workshop de Investigadores en Ciencias de la Computación. Recuperado de http://sedici.unlp.edu.ar/handle/10915/20034Muenchen, B. (2017). The Popularity of Data Science Software. Recuperado de http://r4stats.com/articles/popularityOracle Help Center (2016). Data Warehousing and Business Intelligence. Recuperado de https://docs.oracle.com/cd/B28359_01/datamine.111/ b28129/regress.htmParr Rud, O. (2000). Data mining cookbook: Modeling data for marketing, risk, and customer relationship management. United States: Wiley, John & Sons.Rangra, K. (2014). Comparative study of data mining tools. International Journal of Advanced Research in Computer Science and Software Engineering, vol. (04), pp. 6Remco, R. Eibe, F. (2016). Weka Manual for Version 3-8-1. Recuperado de http://www.cs.waikato.ac.nz/ml/weka/documentation.htmlRohanizadeh, S. y Moghadam, M. (2010). A proposed data mining methodology and its application to industrial procedures. Journal of Industrial Engineering, vol. (4), pp. 37-50Sauter, V. (2011). Decision support systems for business intelligence. New Jersey, Estados Unidos: United Kingdom: Wiley-Blackwell.Society for Learning Analytics Research – SoLAR. (2014). About SOLAR. Recuperado el 10 de abril de 2016 de http://educationaldatamining.org/Statistical Analysis System - SAS Institute Inc (2003). Data Mining Using SAS Enterprise Miner: A Case Study Approach. Recuperado de http://support.sas.com/documentation/onlinedoc/miner/casestudy_59123.pdfTimaran Pereira, R. (2009). Una lectura sobre deserción universitaria en estudiantes de pregrado desde la perspectiva de la Minería de Datos. Recuperado el 20 de mayo de 2016 de http://www.redalyc.org/html/1053/105317327011/Turban, E. y Sharda, R. y Denle, D. y King, D. (2013). Business intelligence: A managerial perspective on Analytics. Boston, Estados Unidos: Prentice HallUniversidad Autónoma de Bucaramanga (2016a). Acerca de la UNAB. Recuperado de http://unab.edu.co/nosotros/acerca-deUniversidad Autónoma de Bucaramanga (2016b). Bienestar Universitario. Recuperado de http://unab.edu.co/nosotros/bienestar-universitarioUniversity of Ljubljana (2016). License Orange. Recuperado de http://orange.biolab.si/license/Valenzuela, J. Flores, M. (2014). Fundamentos de Investigación Educativa. Ciudad de México, México: Editorial digital del tecnológico de Monterrey.Vercellis, C. (2011). Business intelligence: Data mining and optimization for decision making. United States: Wiley, John & Sons.Witten, I. y Frank, E. y Hall, M. (2005). Data mining: Practical machine learning tools and techniques. San Francisco, CA: Morgan Kaufmann Publishers.ORIGINAL2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdfTesisapplication/pdf4766985https://repository.unab.edu.co/bitstream/20.500.12749/3439/1/2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf757bb90081847754eb571eab793d71dcMD51open access2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdfArtículoapplication/pdf1136703https://repository.unab.edu.co/bitstream/20.500.12749/3439/2/2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf4ddc32607dbd7d555f27d9113d8d034aMD52open accessAnexos.zipAnexos.zipAnexosapplication/octet-stream9726941https://repository.unab.edu.co/bitstream/20.500.12749/3439/3/Anexos.zip3b49497dfc2feedd5a7f5fe90f4ab330MD53open access2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdfLicenciaapplication/pdf909570https://repository.unab.edu.co/bitstream/20.500.12749/3439/4/2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf27863d640d0e7a1565b3734ec1d524f7MD54metadata only accessTHUMBNAIL2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf.jpg2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf.jpgIM Thumbnailimage/jpeg5458https://repository.unab.edu.co/bitstream/20.500.12749/3439/5/2018_Tesis_Ropero_Silva_Miguel_Eduardo.pdf.jpg8226cba678852b0147e6024ac0256aa0MD55open access2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf.jpg2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf.jpgIM Thumbnailimage/jpeg11054https://repository.unab.edu.co/bitstream/20.500.12749/3439/6/2018_Articulo_Ropero_Silva_Miguel_Eduardo.pdf.jpgc1129837591e9f683a6a1e8dc1d52fc0MD56open access2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf.jpg2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf.jpgIM Thumbnailimage/jpeg10522https://repository.unab.edu.co/bitstream/20.500.12749/3439/7/2018_Licencia_Ropero_Silva_Miguel_Eduardo.pdf.jpg5566d93e17a3b63e4d22047e3fc7279fMD57metadata only access20.500.12749/3439oai:repository.unab.edu.co:20.500.12749/34392021-11-10 14:08:30.54open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |