Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas
RESUMEN : En el presente trabajo se realizó un modelo predictivo cuya respuesta es la clasificación de que una vez una empresa financiera en filipinas, Home Credit, le otorgue un crédito hipotecario a un cliente, éste caiga en default (1) o no (0). En la herramienta Python, y basados en la metodolog...
- Autores:
-
Ramírez Quiceno, Manuela
Medina Báez, Andrés
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2022
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/29065
- Acceso en línea:
- http://hdl.handle.net/10495/29065
- Palabra clave:
- Aprendizaje automático (inteligencia artificial)
Machine learning
Técnicas de predicción
Forecasting
Crédito
Credit
Gestión de riesgos
Risk management
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_1954
http://aims.fao.org/aos/agrovoc/c_37934
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id |
UDEA2_d52e21339edd2f004780731ffc993ca7 |
---|---|
oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/29065 |
network_acronym_str |
UDEA2 |
network_name_str |
Repositorio UdeA |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
title |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
spellingShingle |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas Aprendizaje automático (inteligencia artificial) Machine learning Técnicas de predicción Forecasting Crédito Credit Gestión de riesgos Risk management http://aims.fao.org/aos/agrovoc/c_3041 http://aims.fao.org/aos/agrovoc/c_1954 http://aims.fao.org/aos/agrovoc/c_37934 |
title_short |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
title_full |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
title_fullStr |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
title_full_unstemmed |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
title_sort |
Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de Filipinas |
dc.creator.fl_str_mv |
Ramírez Quiceno, Manuela Medina Báez, Andrés |
dc.contributor.advisor.none.fl_str_mv |
Oviedo Carrascal, Efraín Alberto |
dc.contributor.author.none.fl_str_mv |
Ramírez Quiceno, Manuela Medina Báez, Andrés |
dc.subject.lemb.none.fl_str_mv |
Aprendizaje automático (inteligencia artificial) Machine learning |
topic |
Aprendizaje automático (inteligencia artificial) Machine learning Técnicas de predicción Forecasting Crédito Credit Gestión de riesgos Risk management http://aims.fao.org/aos/agrovoc/c_3041 http://aims.fao.org/aos/agrovoc/c_1954 http://aims.fao.org/aos/agrovoc/c_37934 |
dc.subject.agrovoc.none.fl_str_mv |
Técnicas de predicción Forecasting Crédito Credit Gestión de riesgos Risk management |
dc.subject.agrovocuri.none.fl_str_mv |
http://aims.fao.org/aos/agrovoc/c_3041 http://aims.fao.org/aos/agrovoc/c_1954 http://aims.fao.org/aos/agrovoc/c_37934 |
description |
RESUMEN : En el presente trabajo se realizó un modelo predictivo cuya respuesta es la clasificación de que una vez una empresa financiera en filipinas, Home Credit, le otorgue un crédito hipotecario a un cliente, éste caiga en default (1) o no (0). En la herramienta Python, y basados en la metodología de trabajo CRISP-DM, inicialmente se realizó la exploración de los datos, conformado por 7 dataset y un total de 220 variables de orden sociodemográfico y del historial crediticio de cada cliente, tanto en Home Credit como en el sector externo. Posteriormente, se prepararon los datos mediante la eliminación de duplicados y de variables irrelevantes o redundantes, tratamiento de atípicos y de missings, codificación de variables categóricas, revisión de correlación, análisis univariable y bivariable, y balanceo de los datos debido a que las clases están desbalanceadas: Solo el 8% de 295.221 clientes pertenecen a la categoría 1, es decir, clientes que caen en default. Finalmente, empleando KBest de SKlearn, se seleccionan las 15 variables más relevantes a la hora de predecir el default del cliente, probando diferentes técnicas de Machine Learning como Decision Tree Classifier, Support Vector Machine, Naive Bayes, Random Forest Classifier, y Logistic Regression siendo este último el ganador para la métrica ROC_AUC de 0.71. La validez del modelo se logró ratificar mediante Cross Validation, con un KFold de 10, cuyos resultados para la métrica fueron de 0.70 y 0.0073 para la media y la desviación estándar respectivamente. Finalmente, en la evaluación final de la técnica ganadora con la data de prueba, el modelo predice los casos en default con un Recall del 64%. Los resultados muestran que el modelo obtenido a partir de los datos dispuestos tiene un desempeño aceptable a la hora de predecir el default de un cliente. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-06-09T14:33:33Z |
dc.date.available.none.fl_str_mv |
2022-06-09T14:33:33Z |
dc.date.issued.none.fl_str_mv |
2022 |
dc.type.spa.fl_str_mv |
info:eu-repo/semantics/other |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.type.hasversion.spa.fl_str_mv |
info:eu-repo/semantics/draft |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_46ec |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/COther |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Especialización |
format |
http://purl.org/coar/resource_type/c_46ec |
status_str |
draft |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/29065 |
url |
http://hdl.handle.net/10495/29065 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.rights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ |
dc.rights.accessrights.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ http://purl.org/coar/access_right/c_abf2 https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.format.extent.spa.fl_str_mv |
47 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.place.spa.fl_str_mv |
Medellín - Colombia |
institution |
Universidad de Antioquia |
bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/3/license_rdf https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/2/MedinaAndres_2022_AplicacionMachineLearning.pdf https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/4/license.txt |
bitstream.checksum.fl_str_mv |
e2060682c9c70d4d30c83c51448f4eed 7b3fba8084b8ff19f02c45aae1c0a78e 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad de Antioquia |
repository.mail.fl_str_mv |
andres.perez@udea.edu.co |
_version_ |
1812173093010931712 |
spelling |
Oviedo Carrascal, Efraín AlbertoRamírez Quiceno, ManuelaMedina Báez, Andrés2022-06-09T14:33:33Z2022-06-09T14:33:33Z2022http://hdl.handle.net/10495/29065RESUMEN : En el presente trabajo se realizó un modelo predictivo cuya respuesta es la clasificación de que una vez una empresa financiera en filipinas, Home Credit, le otorgue un crédito hipotecario a un cliente, éste caiga en default (1) o no (0). En la herramienta Python, y basados en la metodología de trabajo CRISP-DM, inicialmente se realizó la exploración de los datos, conformado por 7 dataset y un total de 220 variables de orden sociodemográfico y del historial crediticio de cada cliente, tanto en Home Credit como en el sector externo. Posteriormente, se prepararon los datos mediante la eliminación de duplicados y de variables irrelevantes o redundantes, tratamiento de atípicos y de missings, codificación de variables categóricas, revisión de correlación, análisis univariable y bivariable, y balanceo de los datos debido a que las clases están desbalanceadas: Solo el 8% de 295.221 clientes pertenecen a la categoría 1, es decir, clientes que caen en default. Finalmente, empleando KBest de SKlearn, se seleccionan las 15 variables más relevantes a la hora de predecir el default del cliente, probando diferentes técnicas de Machine Learning como Decision Tree Classifier, Support Vector Machine, Naive Bayes, Random Forest Classifier, y Logistic Regression siendo este último el ganador para la métrica ROC_AUC de 0.71. La validez del modelo se logró ratificar mediante Cross Validation, con un KFold de 10, cuyos resultados para la métrica fueron de 0.70 y 0.0073 para la media y la desviación estándar respectivamente. Finalmente, en la evaluación final de la técnica ganadora con la data de prueba, el modelo predice los casos en default con un Recall del 64%. Los resultados muestran que el modelo obtenido a partir de los datos dispuestos tiene un desempeño aceptable a la hora de predecir el default de un cliente.47application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/otherhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/Aplicación de técnicas de Machine Learning para la predicción del riesgo de default de un cliente en una compañía de FilipinasMedellín - ColombiaAprendizaje automático (inteligencia artificial)Machine learningTécnicas de predicciónForecastingCréditoCreditGestión de riesgosRisk managementhttp://aims.fao.org/aos/agrovoc/c_3041http://aims.fao.org/aos/agrovoc/c_1954http://aims.fao.org/aos/agrovoc/c_37934https://github.com/AMedinaBaez/Monografia_riesgo_defaultEspecialista en Analítica y Ciencia de DatosEspecializaciónFacultad de Ingeniería. Especialización en Analítica y Ciencia de DatosUniversidad de AntioquiaCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/3/license_rdfe2060682c9c70d4d30c83c51448f4eedMD53ORIGINALMedinaAndres_2022_AplicacionMachineLearning.pdfMedinaAndres_2022_AplicacionMachineLearning.pdfTrabajo de grado de especializaciónapplication/pdf1259484https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/2/MedinaAndres_2022_AplicacionMachineLearning.pdf7b3fba8084b8ff19f02c45aae1c0a78eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstream/10495/29065/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5410495/29065oai:bibliotecadigital.udea.edu.co:10495/290652022-06-09 09:34:01.877Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |