Detección de fraude en transacciones comerciales de clientes aplicando métodos de ML

RESUMEN : Después de realizar una revisión de los métodos de aprendizaje automático que han sido reportados en diferentes literaturas para la predicción de fraude se ha encontrado que con ayuda de la aplicación de técnicas de procesamiento es posible encontrar una ruta adecuada para dar solución a u...

Full description

Autores:
Florez Bedoya, Laura Andrea
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/24605
Acceso en línea:
http://hdl.handle.net/10495/24605
Palabra clave:
Análisis de datos
Data analysis
Aprendizaje electrónico
Machine learning
Fraude
Fraud
Detección de fraude
Aprendizaje supervisado
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_8139c3d0
http://vocabularies.unesco.org/thesaurus/concept2214
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : Después de realizar una revisión de los métodos de aprendizaje automático que han sido reportados en diferentes literaturas para la predicción de fraude se ha encontrado que con ayuda de la aplicación de técnicas de procesamiento es posible encontrar una ruta adecuada para dar solución a una problemática tan actual como lo es el fraude en comercios electrónicos. Entre los métodos de ML evaluados es posible mencionar especialmente, las técnicas de aprendizaje supervisado, cuyos modelos de clasificación pueden etiquetar eventos como buenos (donde las transacciones son genuinas) o malos (cuando el comportamiento asociado no es correcto o fraudulento). Además de la aplicación de los modelos supervisados se hacen uso también, de técnicas de procesamiento que por medio de los mismos datos realizan transformaciones y nuevas inferencias que puedan describir con mayor detalle el comportamiento de un cliente a lo largo de una transacción o en el establecimiento de señales de fraude. Estas implementaciones incluyen la generación de características o el agrupamiento de variables sobre información relevante en una transacción electrónica como, las formas de pago o la identidad de un usuario. Durante la investigación se examinó con detalle el uso de diferentes métodos y subprocesos de ML con el fin de determinar cuál es la mejor opción para lograr una adecuada predicción de fraude sobre una fuente abundante de información recopilada (con gran dimensionalidad). La modelización incluyó un análisis de los modelos y del efecto de algunos métodos de procesamiento (como ingeniería de características, escalamiento y ajuste de desbalanceo) sobre la predicción de casos fraudulentos, evaluando su rendimiento por medio de distintas métricas de clasificación. Los resultados mostraron que al hacer uso del ajuste de hiperparámetros para métodos de aprendizaje supervisado en conjunto con la aplicación de técnicas de procesamiento es posible obtener modelos optimizados que presenten buen comportamiento de predicción en evento fraudulentos. Un factor importante que se observó fue la influencia del escalamiento sobre la predicción, donde la evaluación de dichos modelos con ayuda de distintas métricas evidenció la influencia directa de estas transformaciones numéricas sobre los verdaderos negativos hallados (que representan los casos de fraude). Los resultados de la modelización y del análisis realizado se presentan de forma que puedan ser usados a futuro en estudios más profundos sobre la detección de fraude.