Modelos de machine learning para clasificar la cartera en un fondo de pensiones

El presente trabajo tiene como objetivo, a través de la aplicación de diferentes técnicas de Machine Learning y diagnósticos estadísticos e inferenciales, proponer modelos de análisis predictivos que permitan identificar, clasificar y procesar oportunamente cuáles son las empresas que no pagan los a...

Full description

Autores:
Gil Rubio, Ricardo
Tipo de recurso:
Masters Thesis
Fecha de publicación:
2022
Institución:
Universidad Santo Tomás
Repositorio:
Universidad Santo Tomás
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/47294
Acceso en línea:
http://hdl.handle.net/11634/47294
Palabra clave:
Estadísticas
Pensionados
Trabajadores
Machine learning
regresión logística
máquinas de vectores de soporte,
árboles de decisión
redes neuronales
redes bayesianas
cartera
fondos de pensiones
, mora
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SantoToma2_bfdb51c70bd48107b1750b4d12ffc34d
oai_identifier_str oai:repository.usta.edu.co:11634/47294
network_acronym_str SantoToma2
network_name_str Universidad Santo Tomás
repository_id_str
dc.title.spa.fl_str_mv Modelos de machine learning para clasificar la cartera en un fondo de pensiones
title Modelos de machine learning para clasificar la cartera en un fondo de pensiones
spellingShingle Modelos de machine learning para clasificar la cartera en un fondo de pensiones
Estadísticas
Pensionados
Trabajadores
Machine learning
regresión logística
máquinas de vectores de soporte,
árboles de decisión
redes neuronales
redes bayesianas
cartera
fondos de pensiones
, mora
title_short Modelos de machine learning para clasificar la cartera en un fondo de pensiones
title_full Modelos de machine learning para clasificar la cartera en un fondo de pensiones
title_fullStr Modelos de machine learning para clasificar la cartera en un fondo de pensiones
title_full_unstemmed Modelos de machine learning para clasificar la cartera en un fondo de pensiones
title_sort Modelos de machine learning para clasificar la cartera en un fondo de pensiones
dc.creator.fl_str_mv Gil Rubio, Ricardo
dc.contributor.advisor.none.fl_str_mv Cruz Pérez, Edwin Andrés
Perdomo Charry, Oscar
dc.contributor.author.none.fl_str_mv Gil Rubio, Ricardo
dc.contributor.orcid.spa.fl_str_mv https://orcid.org/0000-0003-2134-0058
dc.contributor.googlescholar.spa.fl_str_mv https://scholar.google.com/citations?hl=es&user=e6Oad5sAAAAJ
dc.contributor.cvlac.spa.fl_str_mv https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001525346
dc.contributor.corporatename.spa.fl_str_mv Universidad Santo Tomás
dc.subject.lemb.spa.fl_str_mv Estadísticas
Pensionados
Trabajadores
topic Estadísticas
Pensionados
Trabajadores
Machine learning
regresión logística
máquinas de vectores de soporte,
árboles de decisión
redes neuronales
redes bayesianas
cartera
fondos de pensiones
, mora
dc.subject.proposal.spa.fl_str_mv Machine learning
regresión logística
máquinas de vectores de soporte,
árboles de decisión
redes neuronales
redes bayesianas
cartera
fondos de pensiones
, mora
description El presente trabajo tiene como objetivo, a través de la aplicación de diferentes técnicas de Machine Learning y diagnósticos estadísticos e inferenciales, proponer modelos de análisis predictivos que permitan identificar, clasificar y procesar oportunamente cuáles son las empresas que no pagan los aportes de pensión a sus trabajadores afiliados al fondo de pensiones, y así implementar diferentes estrategias de cobro encaminadas a recuperar los dineros adeudados. En el proceso de evaluación de rendimiento de los modelos se logró evidenciar que la técnica Árboles de Decisión presenta excelentes resultados: no requirió estandarización de los datos al lograr un porcentaje de certeza excelente y clasificó de forma rápida y eficiente la variable predictora en una base de datos con un número adecuado de registros. Las demás técnicas mostraron buenos resultados en la clase tipo 0, 3 y 4 con porcentajes superiores al 96,8% tanto en exhaustividad como en medida-F, mientras se redujo el desempeño para las técnicas Regresión Logística 71,8% y Máquinas de Vectores de Soporte 69,2% en exhaustividad y Redes Bayesianas 18,5% en medida-F, lo anterior para la clase tipo 1. En la técnica Redes Bayesianas para la clase tipo 2 se redujo en 24,7% y 29,3% tanto en exhaustividad como en medida-F y Máquinas de Vectores de Soporte en 59,4% para medida-F. Lo anterior se abordo con el tratamiento de clases desbalanceadas y con los algoritmos de refuerzo o conjunto. El desequilibrio de clases es una problema bastante frecuente cuando se trabaja con datos reales; cuando muestras de una o de múltiples clases están sobre representadas en un conjunto de datos. Existen varios ámbitos en los que puede ocurrir, como el filtrado de spam, detección de cáncer, la identificación de fraude o la detección de enfermedades. Las estrategias para tratar el desequilibrio de clases incluyen el muestreo ascendente de la clase minoritaria, el muestreo descendente de la clase mayoritaria y la generación de muestras de entrenamiento sintéticas mediante el algoritmo más utilizado (SMOTE, por sus siglas en Inglés). Una vez evaluados los modelos con la segmentación propuesta se generaron las estrategias que permitieron identificar los mecanismos de gestión de cobro dependiente del tipo de deudor, esto va, desde una visita comercial, gestión de contact center para cobro preventivo o un extracto con información de pagos, para deudores de baja criticidad, pasando por una carta de cobro persuasivo, asesoramiento en los puntos de atención o mensajes de texto para deudores de criticidad media, hasta el proceso de cobro coactivo, embargos y demás medidas para los deudores que son renuentes al pago.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-09-22T15:43:07Z
dc.date.available.none.fl_str_mv 2022-09-22T15:43:07Z
dc.date.issued.none.fl_str_mv 2022-09-22
dc.type.local.spa.fl_str_mv Tesis de maestría
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/masterThesis
format http://purl.org/coar/resource_type/c_bdcc
status_str acceptedVersion
dc.identifier.citation.spa.fl_str_mv Gil Rubio, R. (2022). Modelos de machine learning para clasificar la cartera en un fondo de pensiones. [Maestría, Universidad Santpo Tomás]. Repositorio institucional.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/47294
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Gil Rubio, R. (2022). Modelos de machine learning para clasificar la cartera en un fondo de pensiones. [Maestría, Universidad Santpo Tomás]. Repositorio institucional.
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/47294
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Agresti, A. (2002). Análisis de datos categóricos. Segunda edición, John Wiley & Sons, Inc., Nueva York. En línea. Recuperado de: http://dx.doi.org/10.1002/0471249688.
Alpaydin, E. (2004). Introduction to Machine Learning. The MIT press Cambridge, MA.
Amat, J. (2016). Regresión logística simple y múltiple. https://www.cienciadedatos.net/documentos/27- \_regresion\_logistica\_simple\_y\_multiple.
Aruna, R. \& Nirmala, K. (2013). Construction of Decision Tree: Attribute Selection Measures. International Journal of Advancements in Research & Technology, Volume 2, Issue 4. Recuperado de: http://www.ijoart.org/docs/Construction-of-Decision-Tree--Attribute-Selection-Measures.pdf.
Brito, F. \& Artes, R. (2018). Aplicación de árboles de regresión aditiva bayesiana en el desarrollo de modelos de calificación crediticia en Brasil. Producción, 28., https://doi.org/10.1590/0103-6513.20170110.
Cohen, J. (1960). Un coeficiente de acuerdo con las escalas nominales. Medida educativa y psicológica, 20 (1), pp. 37-46. Doi: 10.1177 / 001316446002000104.
Colfondos. (2013). Manual del participante, Ley 100 de 1993.En línea. Recuperado de: https://www.colfondos.com.co/dxp/documents/20143/37693/LEY+100+DE+1993.pdf/c2be65aa-08dd-decc-447c-647409ce4f12.
International Business Machines Corporation (2019). Funcionamiento de SVM. Recuperado de: https://www.ibm.com/docs/es/spss-modeler/SaaS?topic=models-how-svm-works.
Garcia, N. (2020).Qué son los árboles de decisión y para que sirven.Recuperado de: https://www.maximaformacion.es/blog-dat/que-son-los-arboles-de-decision-y-para-que-sirven/.
Husejinovic et al. (2018). Aplicación de algoritmos de aprendizaje automático en la predicción de pagos predeterminados de tarjetas de crédito.Recuperado de: https://www.researchgate.net/publication/328026972-Application-of-Machine- Learning-Algorithms-in-Credit-Card-Default-Payment-Prediction.
Ironhack (2015). ¿En qué consiste el Machine Learning?. En línea. Recuperado de: https://www.ironhack.com/es/data-analytics/que-es-machine-learning.
López, R. (2015). Machine Learning con Python. En línea. Recuperado de: https://relopezbriega.github.io/blog/2015/10/10/machine-learning-con-python/.
Mendoza, J. (2020). XGBoost en Python. En línea. Recuperado de: https://medium.com/@jboscomendoza/tutorial-xgboost-en-python-53e48fc58f73.
Müller, A. \& Guido, S. (2017). Introduction to Machine Learning with Python. A Guide for Data Scientists. O'reilly, United States of America.
Naviani, (2018).Clasificador AdaBoost en Python. Recuperado de: https://www.datacamp.com/tutorial/adaboost-classifier-python#rdl.
Nieto, S. (2010). Crédito al Consumo: La estadística aplicada a un problema de riesgo crediticio [Tesis de Maestría]. Universidad Autónoma Metropolitana. Recuperado de: http://mat.izt.uam.mx/mcmai/documentos/tesis/Gen.07-O/Nieto-S-Tesis.pdf.
Olarte, N. (8 de abril de 2016). El pequeño dato que puede arruinar su futuro. Revista Semana. En línea. Recuperado de: http://www.finanzaspersonales.co/pensiones-y-cesantias/articulo/que-hacer-cuando-la-empresa-no-hace-aportes-a-pension/59958.Fecha de consulta: noviembre de 2018.
Oñate (2016). Análisis de la Deserción y Permanencia Académica en la Educación superior Aplicando Minería De Datos. Universidad Nacional de Colombia.
Parra, F. (2017). Estadística y Machine Learning con R. Rpubs. Recuperado de: https://rpubs.com/PacoParra/293405, Fecha de consulta: noviembre de 2018.
Raschka \& Mirjalili (2019). Python Machine Learning. Aprendizaje automático y aprendizaje profundo con Python, scikit-learn y TensorFlow. Marcombo.
Resolución 2082 de 2016 (2017). Principales cambios o ajustes. Proceso de extracción de conocimiento. Unidad de Gestión Pensional y Parafiscales.
Ruiz, S. (2016). Algoritmos de clasificación: K-NN, Árboles de decisión simples y múltiples (random forest). En línea. Recuperado de: https://rstudio-pubs-static.s3.amazonaws.com.
Sancho, F. (2017). Redes Neuronales: una visión superficial. En línea. Recuperado de: http://www.cs.us.es/~fsancho/?e=72.
Srinath \& Gururaja (2022). Aprendizaje automático explicable en la identificación de morosos de tarjetas de crédito.Recuperado de: https://www.sciencedirect.com/science/article/pii/S2666285X22000619.
Statistical Analysis System (SAS) Institute. (2019). Machine Learning, una expresión de la Inteligencia Artificial. En línea. Recuperado de: https://www.sas.com/content/dam/SAS/es_mx/doc/whitepaper1/109075_0917.pdf.
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Bogotá
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Maestría Estadística Aplicada
dc.publisher.faculty.spa.fl_str_mv Facultad de Estadística
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/47294/5/license.txt
https://repository.usta.edu.co/bitstream/11634/47294/1/2022ricardogil.pdf
https://repository.usta.edu.co/bitstream/11634/47294/2/Carta%20Aprobaci%c3%b3n%20Facultad.pdf
https://repository.usta.edu.co/bitstream/11634/47294/3/Carta%20Derechos%20de%20Autor.pdf
https://repository.usta.edu.co/bitstream/11634/47294/4/license_rdf
https://repository.usta.edu.co/bitstream/11634/47294/6/2022ricardogil.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/47294/7/Carta%20Aprobaci%c3%b3n%20Facultad.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/47294/8/Carta%20Derechos%20de%20Autor.pdf.jpg
bitstream.checksum.fl_str_mv aedeaf396fcd827b537c73d23464fc27
c055dc223e791be9ea5a84b2a1c21b91
e37e9d3d95c8c6784f6b0c5fe82a47e3
6d8905348befa078ee90dcc26e1cd171
217700a34da79ed616c2feb68d4c5e06
4d39ec3e32bb53e97daf087cc442b344
aca26d5ff4df1fb495f24c83971a1756
646e47fb62aad3a6496b5adb6e929d1a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv repositorio@usantotomas.edu.co
_version_ 1800786402483372032
spelling Cruz Pérez, Edwin AndrésPerdomo Charry, OscarGil Rubio, Ricardohttps://orcid.org/0000-0003-2134-0058https://scholar.google.com/citations?hl=es&user=e6Oad5sAAAAJhttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001525346Universidad Santo Tomás2022-09-22T15:43:07Z2022-09-22T15:43:07Z2022-09-22Gil Rubio, R. (2022). Modelos de machine learning para clasificar la cartera en un fondo de pensiones. [Maestría, Universidad Santpo Tomás]. Repositorio institucional.http://hdl.handle.net/11634/47294reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEl presente trabajo tiene como objetivo, a través de la aplicación de diferentes técnicas de Machine Learning y diagnósticos estadísticos e inferenciales, proponer modelos de análisis predictivos que permitan identificar, clasificar y procesar oportunamente cuáles son las empresas que no pagan los aportes de pensión a sus trabajadores afiliados al fondo de pensiones, y así implementar diferentes estrategias de cobro encaminadas a recuperar los dineros adeudados. En el proceso de evaluación de rendimiento de los modelos se logró evidenciar que la técnica Árboles de Decisión presenta excelentes resultados: no requirió estandarización de los datos al lograr un porcentaje de certeza excelente y clasificó de forma rápida y eficiente la variable predictora en una base de datos con un número adecuado de registros. Las demás técnicas mostraron buenos resultados en la clase tipo 0, 3 y 4 con porcentajes superiores al 96,8% tanto en exhaustividad como en medida-F, mientras se redujo el desempeño para las técnicas Regresión Logística 71,8% y Máquinas de Vectores de Soporte 69,2% en exhaustividad y Redes Bayesianas 18,5% en medida-F, lo anterior para la clase tipo 1. En la técnica Redes Bayesianas para la clase tipo 2 se redujo en 24,7% y 29,3% tanto en exhaustividad como en medida-F y Máquinas de Vectores de Soporte en 59,4% para medida-F. Lo anterior se abordo con el tratamiento de clases desbalanceadas y con los algoritmos de refuerzo o conjunto. El desequilibrio de clases es una problema bastante frecuente cuando se trabaja con datos reales; cuando muestras de una o de múltiples clases están sobre representadas en un conjunto de datos. Existen varios ámbitos en los que puede ocurrir, como el filtrado de spam, detección de cáncer, la identificación de fraude o la detección de enfermedades. Las estrategias para tratar el desequilibrio de clases incluyen el muestreo ascendente de la clase minoritaria, el muestreo descendente de la clase mayoritaria y la generación de muestras de entrenamiento sintéticas mediante el algoritmo más utilizado (SMOTE, por sus siglas en Inglés). Una vez evaluados los modelos con la segmentación propuesta se generaron las estrategias que permitieron identificar los mecanismos de gestión de cobro dependiente del tipo de deudor, esto va, desde una visita comercial, gestión de contact center para cobro preventivo o un extracto con información de pagos, para deudores de baja criticidad, pasando por una carta de cobro persuasivo, asesoramiento en los puntos de atención o mensajes de texto para deudores de criticidad media, hasta el proceso de cobro coactivo, embargos y demás medidas para los deudores que son renuentes al pago.The present paper has as objective, the application of different Machine Learning techniques as well as statistical and inferential diagnostics, to propose predictive analysis models that allow to in due time identify, classify and process the companies that are not paying pension contributions to their employees affiliated to the pension fund, and thus to implement different collection strategies to recover contributions owed. In the process of evaluating the performance of the models, it was possible to show that the Decision Trees technique presents excellent results: it did not require standardization of the data by achieving an excellent percentage of certainty and it quickly and efficiently classified the predictor variable in a database with an adequate number of records. The other techniques showed good results in class type 0, 3 and 4 with percentages above 96.8\% both in completeness and in measure-F, while the performance decreased for Logistic Regression 71.8\% and Support Vector Machines 69.2\% in completeness and Bayesian Networks 18.5\% in measure-F, the above for class type 1. In the Bayesian Networks technique for class type 2 it was reduced by 24.7\% and 29.3\% both in completeness and F-measure and Support Vector Machines at 59.4\% for F-measure. This was addressed with the treatment of unbalanced classes and with the reinforcement or ensemble algorithms. Class imbalance is a fairly common problem when working with real data; when samples from one or multiple classes are over represented in a data set. There are several areas in which it can occur, such as spam filtering, cancer detection, fraud identification or disease detection. Strategies to deal with class imbalance include minority class up sampling, majority class down sampling, and generation of synthetic training samples using the most commonly used algorithm (SMOTE). Once the models with the proposed segmentation were evaluated, the strategies were generated that allowed identifying the collection management mechanisms depending on the type of debtor, this ranges from a commercial visit, contact center management for preventive collection or an extract with payment information, for debtors of low criticality, going through a persuasive collection letter, advice at service points or text messages for debtors of medium criticality, to the coercive collection process, embargoes and other measures for debtors who are reluctant to pay.Magister en Estadística AplicadaMaestríaapplication/pdfspaUniversidad Santo TomásMaestría Estadística AplicadaFacultad de EstadísticaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelos de machine learning para clasificar la cartera en un fondo de pensionesEstadísticasPensionadosTrabajadoresMachine learningregresión logísticamáquinas de vectores de soporte,árboles de decisiónredes neuronalesredes bayesianascarterafondos de pensiones, moraTesis de maestríainfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:eu-repo/semantics/masterThesisCRAI-USTA BogotáAgresti, A. (2002). Análisis de datos categóricos. Segunda edición, John Wiley & Sons, Inc., Nueva York. En línea. Recuperado de: http://dx.doi.org/10.1002/0471249688.Alpaydin, E. (2004). Introduction to Machine Learning. The MIT press Cambridge, MA.Amat, J. (2016). Regresión logística simple y múltiple. https://www.cienciadedatos.net/documentos/27- \_regresion\_logistica\_simple\_y\_multiple.Aruna, R. \& Nirmala, K. (2013). Construction of Decision Tree: Attribute Selection Measures. International Journal of Advancements in Research & Technology, Volume 2, Issue 4. Recuperado de: http://www.ijoart.org/docs/Construction-of-Decision-Tree--Attribute-Selection-Measures.pdf.Brito, F. \& Artes, R. (2018). Aplicación de árboles de regresión aditiva bayesiana en el desarrollo de modelos de calificación crediticia en Brasil. Producción, 28., https://doi.org/10.1590/0103-6513.20170110.Cohen, J. (1960). Un coeficiente de acuerdo con las escalas nominales. Medida educativa y psicológica, 20 (1), pp. 37-46. Doi: 10.1177 / 001316446002000104.Colfondos. (2013). Manual del participante, Ley 100 de 1993.En línea. Recuperado de: https://www.colfondos.com.co/dxp/documents/20143/37693/LEY+100+DE+1993.pdf/c2be65aa-08dd-decc-447c-647409ce4f12.International Business Machines Corporation (2019). Funcionamiento de SVM. Recuperado de: https://www.ibm.com/docs/es/spss-modeler/SaaS?topic=models-how-svm-works.Garcia, N. (2020).Qué son los árboles de decisión y para que sirven.Recuperado de: https://www.maximaformacion.es/blog-dat/que-son-los-arboles-de-decision-y-para-que-sirven/.Husejinovic et al. (2018). Aplicación de algoritmos de aprendizaje automático en la predicción de pagos predeterminados de tarjetas de crédito.Recuperado de: https://www.researchgate.net/publication/328026972-Application-of-Machine- Learning-Algorithms-in-Credit-Card-Default-Payment-Prediction.Ironhack (2015). ¿En qué consiste el Machine Learning?. En línea. Recuperado de: https://www.ironhack.com/es/data-analytics/que-es-machine-learning.López, R. (2015). Machine Learning con Python. En línea. Recuperado de: https://relopezbriega.github.io/blog/2015/10/10/machine-learning-con-python/.Mendoza, J. (2020). XGBoost en Python. En línea. Recuperado de: https://medium.com/@jboscomendoza/tutorial-xgboost-en-python-53e48fc58f73.Müller, A. \& Guido, S. (2017). Introduction to Machine Learning with Python. A Guide for Data Scientists. O'reilly, United States of America.Naviani, (2018).Clasificador AdaBoost en Python. Recuperado de: https://www.datacamp.com/tutorial/adaboost-classifier-python#rdl.Nieto, S. (2010). Crédito al Consumo: La estadística aplicada a un problema de riesgo crediticio [Tesis de Maestría]. Universidad Autónoma Metropolitana. Recuperado de: http://mat.izt.uam.mx/mcmai/documentos/tesis/Gen.07-O/Nieto-S-Tesis.pdf.Olarte, N. (8 de abril de 2016). El pequeño dato que puede arruinar su futuro. Revista Semana. En línea. Recuperado de: http://www.finanzaspersonales.co/pensiones-y-cesantias/articulo/que-hacer-cuando-la-empresa-no-hace-aportes-a-pension/59958.Fecha de consulta: noviembre de 2018.Oñate (2016). Análisis de la Deserción y Permanencia Académica en la Educación superior Aplicando Minería De Datos. Universidad Nacional de Colombia.Parra, F. (2017). Estadística y Machine Learning con R. Rpubs. Recuperado de: https://rpubs.com/PacoParra/293405, Fecha de consulta: noviembre de 2018.Raschka \& Mirjalili (2019). Python Machine Learning. Aprendizaje automático y aprendizaje profundo con Python, scikit-learn y TensorFlow. Marcombo.Resolución 2082 de 2016 (2017). Principales cambios o ajustes. Proceso de extracción de conocimiento. Unidad de Gestión Pensional y Parafiscales.Ruiz, S. (2016). Algoritmos de clasificación: K-NN, Árboles de decisión simples y múltiples (random forest). En línea. Recuperado de: https://rstudio-pubs-static.s3.amazonaws.com.Sancho, F. (2017). Redes Neuronales: una visión superficial. En línea. Recuperado de: http://www.cs.us.es/~fsancho/?e=72.Srinath \& Gururaja (2022). Aprendizaje automático explicable en la identificación de morosos de tarjetas de crédito.Recuperado de: https://www.sciencedirect.com/science/article/pii/S2666285X22000619.Statistical Analysis System (SAS) Institute. (2019). Machine Learning, una expresión de la Inteligencia Artificial. En línea. Recuperado de: https://www.sas.com/content/dam/SAS/es_mx/doc/whitepaper1/109075_0917.pdf.LICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/47294/5/license.txtaedeaf396fcd827b537c73d23464fc27MD55open accessORIGINAL2022ricardogil.pdf2022ricardogil.pdfTrabajo de Gradoapplication/pdf1475410https://repository.usta.edu.co/bitstream/11634/47294/1/2022ricardogil.pdfc055dc223e791be9ea5a84b2a1c21b91MD51open accessCarta Aprobación Facultad.pdfCarta Aprobación Facultad.pdfCarta aprobación facultadapplication/pdf131179https://repository.usta.edu.co/bitstream/11634/47294/2/Carta%20Aprobaci%c3%b3n%20Facultad.pdfe37e9d3d95c8c6784f6b0c5fe82a47e3MD52metadata only accessCarta Derechos de Autor.pdfCarta Derechos de Autor.pdfCarta derechos de autorapplication/pdf331709https://repository.usta.edu.co/bitstream/11634/47294/3/Carta%20Derechos%20de%20Autor.pdf6d8905348befa078ee90dcc26e1cd171MD53metadata only accessCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/47294/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessTHUMBNAIL2022ricardogil.pdf.jpg2022ricardogil.pdf.jpgIM Thumbnailimage/jpeg7907https://repository.usta.edu.co/bitstream/11634/47294/6/2022ricardogil.pdf.jpg4d39ec3e32bb53e97daf087cc442b344MD56open accessCarta Aprobación Facultad.pdf.jpgCarta Aprobación Facultad.pdf.jpgIM Thumbnailimage/jpeg8504https://repository.usta.edu.co/bitstream/11634/47294/7/Carta%20Aprobaci%c3%b3n%20Facultad.pdf.jpgaca26d5ff4df1fb495f24c83971a1756MD57open accessCarta Derechos de Autor.pdf.jpgCarta Derechos de Autor.pdf.jpgIM Thumbnailimage/jpeg7329https://repository.usta.edu.co/bitstream/11634/47294/8/Carta%20Derechos%20de%20Autor.pdf.jpg646e47fb62aad3a6496b5adb6e929d1aMD58open access11634/47294oai:repository.usta.edu.co:11634/472942022-12-02 03:12:41.762open accessRepositorio Universidad Santo Tomásrepositorio@usantotomas.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K