Modelos de machine learning para la detección de fraude financiero

RESUMEN : Para el desarrollo de esta monografía se partió de la simulación de transacciones de dinero móvil basadas en una muestra real extraída de un mes de registros financieros implementado en un país africano. Los registros originales fueron proporcionados por una empresa multinacional, proveedo...

Full description

Autores:
Londoño Morales, Leidy Marcela
Carmona Mora, Maricela
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/20164
Acceso en línea:
http://hdl.handle.net/10495/20164
Palabra clave:
Control automático
Automatic control
Instituciones financieras
Financial institutions
Fraude
Fraud
Evaluación del riesgo de fraude
Fraud risk assessment
Gestión de riesgos
Risk management
Logística
Logística
http://aims.fao.org/aos/agrovoc/c_331401
Machine learning
http://aims.fao.org/aos/agrovoc/c_8139c3d0
http://aims.fao.org/aos/agrovoc/c_8159df21
http://aims.fao.org/aos/agrovoc/c_37934
http://vocabularies.unesco.org/thesaurus/concept3399
http://vocabularies.unesco.org/thesaurus/concept10861
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : Para el desarrollo de esta monografía se partió de la simulación de transacciones de dinero móvil basadas en una muestra real extraída de un mes de registros financieros implementado en un país africano. Los registros originales fueron proporcionados por una empresa multinacional, proveedor del servicio financiero móvil. Dichos datos se toman de Kaggle, los cuales corresponden a una cuarta parte del conjunto de datos original. El mayor reto presentado fue contar con un problema asociado al desbalanceo de los datos en términos de los eventos de fraude, ya que dada la ocurrencia del evento es más confuso poder identificar con mayor precisión el fraude y contar adicionalmente con las mejores métricas para tomar decisiones acertadas y poder escoger el modelo a implementar. Dentro de la solución se hace uso de la generación de datos sintéticos para balancear los eventos de fraude y poder comparar los resultados de los modelos teniendo o no este tipo de balanceo.