Detección del fraude financiero mediante la aplicación de técnicas de aprendizaje automático con enfoque basado en anomalías

La detección de fraudes en entornos financieros es un área crítica cuyo objetivo es identificar patrones o actividades anómalas que puedan indicar prácticas fraudulentas. Se implementa un sistema de detección de fraudes financieros utilizando modelos supervisados, como Random Forest, Logistic Regres...

Full description

Autores:
Bustamante Molano, Luisa Ximena
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad Cooperativa de Colombia
Repositorio:
Repositorio UCC
Idioma:
spa
OAI Identifier:
oai:repository.ucc.edu.co:20.500.12494/56439
Acceso en línea:
https://hdl.handle.net/20.500.12494/56439
Palabra clave:
000 - Ciencias de la computación, información y obras generales
Aprendizaje
Anomalías
Métricas externas
Fraude financiero
Machine learning
Anomalies
External metrics
Financial fraud
Rights
closedAccess
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:La detección de fraudes en entornos financieros es un área crítica cuyo objetivo es identificar patrones o actividades anómalas que puedan indicar prácticas fraudulentas. Se implementa un sistema de detección de fraudes financieros utilizando modelos supervisados, como Random Forest, Logistic Regression y Support Vector Machine, así como modelos no supervisados, como Isolation Forest, Local Outlier Factor y One Class Support Vector Machine. El estudio empleó un enfoque de investigación cuantitativo y experimental con alcance explicativo para aplicar técnicas de aprendizaje automático y medir el rendimiento y la evaluación de los modelos. Se utilizó una metodología de software híbrida (espiral y CRISP-DM), la aplicación se desarrolló utilizando Streamlit en un entorno virtual, que incluye módulos de inicio de sesión, detección e informe de resultados. El modelo One-Class SV destaca por su recall (79%), pero tiene una precisión y una puntuación F1 bajas, lo que puede dar lugar a falsos positivos. Por otro lado, la regresión logística muestra un rendimiento más equilibrado con precisión (1%) y recall (25%). Ambos modelos demuestran una capacidad relativamente mejor para identificar casos positivos.