Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning

RESUMEN: El proyecto consistió en la creación de un sistema predictivo de las cancelaciones de las tarjetas de crédito de los clientes, en donde se probaron 15 modelos con diferentes algoritmos y diferentes configuraciones, el primer modelo es de tipo estadístico y se obtuvo con Regresión logística,...

Full description

Autores:
Mora Hernández, Sebastián
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/17428
Acceso en línea:
http://hdl.handle.net/10495/17428
Palabra clave:
Algoritmo
Algorithms
Análisis de datos
Data analysis
Base de datos
Databases
Crédito
Credit
Instituciones financieras
Financial institutions
Aprendizaje automático
Inteligencia de negocios
Tarjetas de crédito
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept2214
http://vocabularies.unesco.org/thesaurus/concept501
http://vocabularies.unesco.org/thesaurus/concept3570
http://vocabularies.unesco.org/thesaurus/concept10861
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id UDEA2_522ade3940e75b3e54003c0038075d27
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/17428
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
title Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
spellingShingle Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
Algoritmo
Algorithms
Análisis de datos
Data analysis
Base de datos
Databases
Crédito
Credit
Instituciones financieras
Financial institutions
Aprendizaje automático
Inteligencia de negocios
Tarjetas de crédito
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept2214
http://vocabularies.unesco.org/thesaurus/concept501
http://vocabularies.unesco.org/thesaurus/concept3570
http://vocabularies.unesco.org/thesaurus/concept10861
title_short Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
title_full Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
title_fullStr Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
title_full_unstemmed Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
title_sort Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine Learning
dc.creator.fl_str_mv Mora Hernández, Sebastián
dc.contributor.advisor.none.fl_str_mv Isaza Narváez, Claudia Victoria
Muñetón Dillan, Alexis
dc.contributor.author.none.fl_str_mv Mora Hernández, Sebastián
dc.subject.unesco.none.fl_str_mv Algoritmo
Algorithms
Análisis de datos
Data analysis
Base de datos
Databases
Crédito
Credit
Instituciones financieras
Financial institutions
topic Algoritmo
Algorithms
Análisis de datos
Data analysis
Base de datos
Databases
Crédito
Credit
Instituciones financieras
Financial institutions
Aprendizaje automático
Inteligencia de negocios
Tarjetas de crédito
http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept2214
http://vocabularies.unesco.org/thesaurus/concept501
http://vocabularies.unesco.org/thesaurus/concept3570
http://vocabularies.unesco.org/thesaurus/concept10861
dc.subject.proposal.spa.fl_str_mv Aprendizaje automático
Inteligencia de negocios
Tarjetas de crédito
dc.subject.unescouri.none.fl_str_mv http://vocabularies.unesco.org/thesaurus/concept2024
http://vocabularies.unesco.org/thesaurus/concept2214
http://vocabularies.unesco.org/thesaurus/concept501
http://vocabularies.unesco.org/thesaurus/concept3570
http://vocabularies.unesco.org/thesaurus/concept10861
description RESUMEN: El proyecto consistió en la creación de un sistema predictivo de las cancelaciones de las tarjetas de crédito de los clientes, en donde se probaron 15 modelos con diferentes algoritmos y diferentes configuraciones, el primer modelo es de tipo estadístico y se obtuvo con Regresión logística, también se implementaron dos algoritmos de Machine Learning los cuales fueron árboles de decisión y Random Forest. Dado que se trabajó con una base de datos con clases desbalanceadas, se generaron diferentes modelos usando técnicas de balanceo de datos obteniendo mejores resultados respecto a los modelos sin utilizar técnicas de balanceo de datos. Las técnicas usadas fueron el método de SMOTE, método de sobre muestreo el cual crea muestras sintéticas de los datos haciendo que la clase minoritaria tenga el mismo número de muestras que la clase mayoritaria. La segunda técnica fue el método de NEARMISS, método de submuestreo que iguala la cantidad de muestras de la clase mayoritaria a la minoritaria. Los resultados obtenidos para el algoritmo de regresión logística fueron de un 79% de predicción en la cancelación de las tarjetas de crédito. Para el algoritmo de Random Forest se obtuvo un porcentaje de predicción del 84% y para el algoritmo de árboles de decisión se obtuvo un rendimiento del 74%. Una vez que se encontró el modelo que tenía mejor rendimiento, se procedió a integrar del modelo predictivo en un Dashboard de Power BI en donde se pudo observar el desempeño del modelo y, además, el poder aprovechar todas las funcionalidades de Power BI para que el cliente final pueda observar los resultados del modelo predictivo y análisis descriptivos de Python en Power BI.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-11-19T18:47:03Z
dc.date.available.none.fl_str_mv 2020-11-19T18:47:03Z
dc.date.issued.none.fl_str_mv 2020
dc.type.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/draft
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
format http://purl.org/coar/resource_type/c_7a1f
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/17428
url http://hdl.handle.net/10495/17428
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.accessrights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 28
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
institution Universidad de Antioquia
bitstream.url.fl_str_mv http://bibliotecadigital.udea.edu.co/bitstream/10495/17428/1/MoraSebastian_2020_CancelacionTarjetasCredito.pdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/17428/3/license.txt
bitstream.checksum.fl_str_mv bc18cfc703b8e08f9b16644854f3d827
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Antioquia
repository.mail.fl_str_mv andres.perez@udea.edu.co
_version_ 1812173222775357440
spelling Isaza Narváez, Claudia VictoriaMuñetón Dillan, AlexisMora Hernández, Sebastián2020-11-19T18:47:03Z2020-11-19T18:47:03Z2020http://hdl.handle.net/10495/17428RESUMEN: El proyecto consistió en la creación de un sistema predictivo de las cancelaciones de las tarjetas de crédito de los clientes, en donde se probaron 15 modelos con diferentes algoritmos y diferentes configuraciones, el primer modelo es de tipo estadístico y se obtuvo con Regresión logística, también se implementaron dos algoritmos de Machine Learning los cuales fueron árboles de decisión y Random Forest. Dado que se trabajó con una base de datos con clases desbalanceadas, se generaron diferentes modelos usando técnicas de balanceo de datos obteniendo mejores resultados respecto a los modelos sin utilizar técnicas de balanceo de datos. Las técnicas usadas fueron el método de SMOTE, método de sobre muestreo el cual crea muestras sintéticas de los datos haciendo que la clase minoritaria tenga el mismo número de muestras que la clase mayoritaria. La segunda técnica fue el método de NEARMISS, método de submuestreo que iguala la cantidad de muestras de la clase mayoritaria a la minoritaria. Los resultados obtenidos para el algoritmo de regresión logística fueron de un 79% de predicción en la cancelación de las tarjetas de crédito. Para el algoritmo de Random Forest se obtuvo un porcentaje de predicción del 84% y para el algoritmo de árboles de decisión se obtuvo un rendimiento del 74%. Una vez que se encontró el modelo que tenía mejor rendimiento, se procedió a integrar del modelo predictivo en un Dashboard de Power BI en donde se pudo observar el desempeño del modelo y, además, el poder aprovechar todas las funcionalidades de Power BI para que el cliente final pueda observar los resultados del modelo predictivo y análisis descriptivos de Python en Power BI.28application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/version/c_b1a7d7d4d402bcceAtribución-NoComercial-SinDerivadas 2.5 Colombiainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-nd/4.0/Sistema predictivo de cancelaciones en las tarjetas de crédito basada en técnicas de Machine LearningMedellín, ColombiaAlgoritmoAlgorithmsAnálisis de datosData analysisBase de datosDatabasesCréditoCreditInstituciones financierasFinancial institutionsAprendizaje automáticoInteligencia de negociosTarjetas de créditohttp://vocabularies.unesco.org/thesaurus/concept2024http://vocabularies.unesco.org/thesaurus/concept2214http://vocabularies.unesco.org/thesaurus/concept501http://vocabularies.unesco.org/thesaurus/concept3570http://vocabularies.unesco.org/thesaurus/concept10861Ingeniero ElectrónicoPregradoFacultad de Ingeniería. Carrera de Ingeniería ElectrónicaUniversidad de AntioquiaORIGINALMoraSebastian_2020_CancelacionTarjetasCredito.pdfMoraSebastian_2020_CancelacionTarjetasCredito.pdfTrabajo de grado de pregradoapplication/pdf1348557http://bibliotecadigital.udea.edu.co/bitstream/10495/17428/1/MoraSebastian_2020_CancelacionTarjetasCredito.pdfbc18cfc703b8e08f9b16644854f3d827MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://bibliotecadigital.udea.edu.co/bitstream/10495/17428/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310495/17428oai:bibliotecadigital.udea.edu.co:10495/174282021-06-28 15:32:07.219Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=