Detección del fraude financiero mediante la aplicación de técnicas de aprendizaje automático con enfoque basado en anomalías
La detección de fraudes en entornos financieros es un área crítica cuyo objetivo es identificar patrones o actividades anómalas que puedan indicar prácticas fraudulentas. Se implementa un sistema de detección de fraudes financieros utilizando modelos supervisados, como Random Forest, Logistic Regres...
- Autores:
-
Bustamante Molano, Luisa Ximena
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad Cooperativa de Colombia
- Repositorio:
- Repositorio UCC
- Idioma:
- spa
- OAI Identifier:
- oai:repository.ucc.edu.co:20.500.12494/56439
- Acceso en línea:
- https://hdl.handle.net/20.500.12494/56439
- Palabra clave:
- 000 - Ciencias de la computación, información y obras generales
Aprendizaje
Anomalías
Métricas externas
Fraude financiero
Machine learning
Anomalies
External metrics
Financial fraud
- Rights
- closedAccess
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
Summary: | La detección de fraudes en entornos financieros es un área crítica cuyo objetivo es identificar patrones o actividades anómalas que puedan indicar prácticas fraudulentas. Se implementa un sistema de detección de fraudes financieros utilizando modelos supervisados, como Random Forest, Logistic Regression y Support Vector Machine, así como modelos no supervisados, como Isolation Forest, Local Outlier Factor y One Class Support Vector Machine. El estudio empleó un enfoque de investigación cuantitativo y experimental con alcance explicativo para aplicar técnicas de aprendizaje automático y medir el rendimiento y la evaluación de los modelos. Se utilizó una metodología de software híbrida (espiral y CRISP-DM), la aplicación se desarrolló utilizando Streamlit en un entorno virtual, que incluye módulos de inicio de sesión, detección e informe de resultados. El modelo One-Class SV destaca por su recall (79%), pero tiene una precisión y una puntuación F1 bajas, lo que puede dar lugar a falsos positivos. Por otro lado, la regresión logística muestra un rendimiento más equilibrado con precisión (1%) y recall (25%). Ambos modelos demuestran una capacidad relativamente mejor para identificar casos positivos. |
---|