Detección de fraude bancario en Colombia mediante el análisis de grafos

Este proyecto se enfoca en desarrollar un sistema de puntuación de riesgo para los empleados de una entidad financiera, con el objetivo de mitigar el fraude interno. Para ello, se han implementado técnicas avanzadas de grafos, las cuales han demostrado ser cruciales en la identificación de relacione...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Universidad del Rosario
Repositorio:
Repositorio EdocUR - U. Rosario
Idioma:
spa
OAI Identifier:
oai:repository.urosario.edu.co:10336/42296
Acceso en línea:
https://repository.urosario.edu.co/handle/10336/42296
Palabra clave:
Fraude
Riesgo
Machine learning
Grafos
Patrones
Fraud
Risk
Machine learning
Graphs
Patterns
Rights
License
Attribution-NonCommercial-NoDerivatives 4.0 International
id EDOCUR2_9f55c15b2a20036f4de34040f2877f5d
oai_identifier_str oai:repository.urosario.edu.co:10336/42296
network_acronym_str EDOCUR2
network_name_str Repositorio EdocUR - U. Rosario
repository_id_str
dc.title.none.fl_str_mv Detección de fraude bancario en Colombia mediante el análisis de grafos
dc.title.TranslatedTitle.none.fl_str_mv Bank Fraud Detection in Colombia through Graph Analysis
title Detección de fraude bancario en Colombia mediante el análisis de grafos
spellingShingle Detección de fraude bancario en Colombia mediante el análisis de grafos
Fraude
Riesgo
Machine learning
Grafos
Patrones
Fraud
Risk
Machine learning
Graphs
Patterns
title_short Detección de fraude bancario en Colombia mediante el análisis de grafos
title_full Detección de fraude bancario en Colombia mediante el análisis de grafos
title_fullStr Detección de fraude bancario en Colombia mediante el análisis de grafos
title_full_unstemmed Detección de fraude bancario en Colombia mediante el análisis de grafos
title_sort Detección de fraude bancario en Colombia mediante el análisis de grafos
dc.contributor.advisor.none.fl_str_mv Romero Ramírez, Juan Felipe
dc.subject.none.fl_str_mv Fraude
Riesgo
Machine learning
Grafos
Patrones
topic Fraude
Riesgo
Machine learning
Grafos
Patrones
Fraud
Risk
Machine learning
Graphs
Patterns
dc.subject.keyword.none.fl_str_mv Fraud
Risk
Machine learning
Graphs
Patterns
description Este proyecto se enfoca en desarrollar un sistema de puntuación de riesgo para los empleados de una entidad financiera, con el objetivo de mitigar el fraude interno. Para ello, se han implementado técnicas avanzadas de grafos, las cuales han demostrado ser cruciales en la identificación de relaciones complejas entre Además, se ha integrado el uso de modelos de Machine Learning en el proyecto, lo que ha facilitado la creación de algoritmos predictivos. Estos modelos ofrecen la capacidad de prever posibles incidentes de fraude interno, lo que a su vez permite tomar medidas proactivas en la mitigación de riesgos. En resumen, la aplicación de estas metodologías computacionales ha resultado ser extremadamente valiosa, no solo para establecer controles de primera línea eficientes, sino también para desarrollar sistemas predictivos capaces de identificar potenciales defraudadores dentro de la organización financiera.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-02-27T13:13:40Z
dc.date.available.none.fl_str_mv 2024-02-27T13:13:40Z
dc.date.created.none.fl_str_mv 2024-01-02
dc.type.none.fl_str_mv bachelorThesis
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.document.none.fl_str_mv Trabajo de grado
dc.type.spa.none.fl_str_mv Trabajo de grado
dc.identifier.uri.none.fl_str_mv https://repository.urosario.edu.co/handle/10336/42296
url https://repository.urosario.edu.co/handle/10336/42296
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.*.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.acceso.none.fl_str_mv Abierto (Texto Completo)
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
Abierto (Texto Completo)
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 37 pp
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad del Rosario
dc.publisher.department.spa.fl_str_mv Escuela de Ingeniería, Ciencia y Tecnología
dc.publisher.program.spa.fl_str_mv Maestría en Matemáticas Aplicadas y Ciencias de la Computación
institution Universidad del Rosario
dc.source.bibliographicCitation.none.fl_str_mv The institute of internal auditors (2009). Internal Auditing And Fraud.
Khaled Gubran Al-Hashedi, Pritheega Magalingam (2021). Financial fraud detection applying data mining techniques: A comprehensive review from 2009 to 2019.
Abdallah, Zainal (2016). Fraud detection system_ A survey. https://www.sciencedirect.com/science/article/abs/pii/S1084804516300571
Alka Rani, Nishant K. Sinha (2022). Support Vector Machine. https://www.sciencedirect.com/topics/computer-science/support-vector-machine
El Bouchefry PhD, S. de Souza PhD. (2020). Chapter 12 - Learning in Big Data: Introduction to Machine Learning. https://www.sciencedirect.com/science/article/abs/pii/B9780128191545000230
Siqi Cai, Zhenping Xie, explainable fraud detection of financial statement data driven by two-layer knowledge graph (2024). https://www.sciencedirect.com/science/article/abs/pii/S0957417423036308
Claudio Stamile, Aldo Marzullo, Enrico Deusebio. (2021). Graph Machine Learning. Packt Publishing Ltd.
Neo4j, Inc. (2023) Nod2vec. neo4j. https://neo4j.com/docs/graph-data-science/current/machine-learning/node-embeddings/node2vec/
Cohen Elior. (Apr 16, 2018). node2vec: Embeddings for Graph Data. Towards Data Science. https://towardsdatascience.com/node2vec-embeddings-for-graph-data-32a866340fef
Tomaz Bratanic. (Aug 16, 2021). Complete guide to understanding Node2Vec algorithm. Towards Data Science. https://towardsdatascience.com/complete-guide-to-understanding-node2vec-algorithm-4e9a35e5d147
Chris McCormick (19 Apr 2016). Word2Vec Tutorial - The Skip-Gram Model. Mccormickml. http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/
Irene. (April 23, 2020). Node Embeddings: DeepWalk & Node2Vec. wutheringgraphs https://wutheringgraphs.wordpress.com/2020/04/23/node-embeddings-deepwalk-node2vec/
Ballesteros Jaime. (2021). Exploración de modelos transaccionales para recomendaciones de ítems [Grado en Ingeniería Informática, Universidad Autónoma de Madrid]. https://repositorio.uam.es/bitstream/handle/10486/698176/enriquez_ballesteros_jaime_tfg.pdf?sequence=1
PWC. (2022, mayo). Encuesta Global de Crimen y Fraude 2022, PwC Colombia. https://www.pwc.com/co/es/publicaciones/encuesta-crimen-fraude-economico.html
Chapman & Hall (2017). CRC Data Mining and Knowledge Discovery Series. Taylor & Francis Group.
Dutta, K. y Perry, J. (2006). A tale of tails: An empirical analysis of loss distribution models for estimating operational risk capital. Federal Reserve Bank of Boston, Working Paper No. 06-13.
Cortez Samuel. (2022). Introducción a los Métodos de Ensamble y al Algoritmo de XGBoost: Caso Práctico. https://medium.com/@oscars.cortezmo/introducci%C3%B3n-a-los-m%C3%A9todos-de-ensamble-y-al-algoritmo-de-xgboost-caso-pr%C3%A1ctico-e8cb0d58394b
Eafit. (Sin fecha). ¿QUE ES FRAUDE? https://www.eafit.edu.co/escuelas/administracion/consultorio-contable/Documents/A%20FRAUDE.pdf
dc.source.instname.none.fl_str_mv instname:Universidad del Rosario
dc.source.reponame.spa.fl_str_mv reponame:Repositorio Institucional EdocUR
bitstream.url.fl_str_mv https://repository.urosario.edu.co/bitstreams/5a98de86-3876-440f-ba6c-9beb220afc4e/download
https://repository.urosario.edu.co/bitstreams/d7f02f51-af21-4b66-a13b-9a41a6241970/download
https://repository.urosario.edu.co/bitstreams/629e8297-101e-4abc-943d-68b639e7915e/download
https://repository.urosario.edu.co/bitstreams/7e307d04-9fb3-43cc-9fd0-6ed6fa1d76b8/download
https://repository.urosario.edu.co/bitstreams/43970e9b-d152-416c-8cf1-dec4bc5e1dbe/download
bitstream.checksum.fl_str_mv 1b62f50422511c9885988934d6491657
b2825df9f458e9d5d96ee8b7cd74fde6
3b6ce8e9e36c89875e8cf39962fe8920
5c342459a80f163ddec1aa0973716fb2
adc4140b5b4f54a507a21ee5aedc6cb9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional EdocUR
repository.mail.fl_str_mv edocur@urosario.edu.co
_version_ 1808390981431590912
spelling Romero Ramírez, Juan Felipe65f21c8f-b5aa-4c1a-a20d-4ea8a2f6167b-1Calderon Adames, Brayan StevenMagíster en Matemáticas Aplicadas y Ciencias de la ComputaciónFull time54e73b4a-3846-464e-a618-577472a46856-12024-02-27T13:13:40Z2024-02-27T13:13:40Z2024-01-02Este proyecto se enfoca en desarrollar un sistema de puntuación de riesgo para los empleados de una entidad financiera, con el objetivo de mitigar el fraude interno. Para ello, se han implementado técnicas avanzadas de grafos, las cuales han demostrado ser cruciales en la identificación de relaciones complejas entre Además, se ha integrado el uso de modelos de Machine Learning en el proyecto, lo que ha facilitado la creación de algoritmos predictivos. Estos modelos ofrecen la capacidad de prever posibles incidentes de fraude interno, lo que a su vez permite tomar medidas proactivas en la mitigación de riesgos. En resumen, la aplicación de estas metodologías computacionales ha resultado ser extremadamente valiosa, no solo para establecer controles de primera línea eficientes, sino también para desarrollar sistemas predictivos capaces de identificar potenciales defraudadores dentro de la organización financiera.This project focuses on developing a risk scoring system for employees of a financial entity, aimed at mitigating internal fraud. To achieve this, advanced graph techniques have been implemented, proving to be crucial in identifying complex relationships between employees and clients. These graphs have been fundamental in capturing vital and consistent information, enabling effective detection of anomalies in interactions between these parties. Furthermore, the integration of Machine Learning models into the project has facilitated the creation of predictive algorithms. These models provide the capability to foresee potential internal fraud incidents, thereby allowing for proactive risk mitigation measures. In summary, the application of these computational methodologies has proven to be extremely valuable, not only in establishing efficient frontline controls but also in developing predictive systems capable of identifying potential fraudsters within the financial organization.37 ppapplication/pdfhttps://repository.urosario.edu.co/handle/10336/42296spaUniversidad del RosarioEscuela de Ingeniería, Ciencia y TecnologíaMaestría en Matemáticas Aplicadas y Ciencias de la ComputaciónAttribution-NonCommercial-NoDerivatives 4.0 InternationalAbierto (Texto Completo)http://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2The institute of internal auditors (2009). Internal Auditing And Fraud.Khaled Gubran Al-Hashedi, Pritheega Magalingam (2021). Financial fraud detection applying data mining techniques: A comprehensive review from 2009 to 2019.Abdallah, Zainal (2016). Fraud detection system_ A survey. https://www.sciencedirect.com/science/article/abs/pii/S1084804516300571Alka Rani, Nishant K. Sinha (2022). Support Vector Machine. https://www.sciencedirect.com/topics/computer-science/support-vector-machineEl Bouchefry PhD, S. de Souza PhD. (2020). Chapter 12 - Learning in Big Data: Introduction to Machine Learning. https://www.sciencedirect.com/science/article/abs/pii/B9780128191545000230Siqi Cai, Zhenping Xie, explainable fraud detection of financial statement data driven by two-layer knowledge graph (2024). https://www.sciencedirect.com/science/article/abs/pii/S0957417423036308Claudio Stamile, Aldo Marzullo, Enrico Deusebio. (2021). Graph Machine Learning. Packt Publishing Ltd.Neo4j, Inc. (2023) Nod2vec. neo4j. https://neo4j.com/docs/graph-data-science/current/machine-learning/node-embeddings/node2vec/Cohen Elior. (Apr 16, 2018). node2vec: Embeddings for Graph Data. Towards Data Science. https://towardsdatascience.com/node2vec-embeddings-for-graph-data-32a866340fefTomaz Bratanic. (Aug 16, 2021). Complete guide to understanding Node2Vec algorithm. Towards Data Science. https://towardsdatascience.com/complete-guide-to-understanding-node2vec-algorithm-4e9a35e5d147Chris McCormick (19 Apr 2016). Word2Vec Tutorial - The Skip-Gram Model. Mccormickml. http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/Irene. (April 23, 2020). Node Embeddings: DeepWalk & Node2Vec. wutheringgraphs https://wutheringgraphs.wordpress.com/2020/04/23/node-embeddings-deepwalk-node2vec/Ballesteros Jaime. (2021). Exploración de modelos transaccionales para recomendaciones de ítems [Grado en Ingeniería Informática, Universidad Autónoma de Madrid]. https://repositorio.uam.es/bitstream/handle/10486/698176/enriquez_ballesteros_jaime_tfg.pdf?sequence=1PWC. (2022, mayo). Encuesta Global de Crimen y Fraude 2022, PwC Colombia. https://www.pwc.com/co/es/publicaciones/encuesta-crimen-fraude-economico.htmlChapman & Hall (2017). CRC Data Mining and Knowledge Discovery Series. Taylor & Francis Group.Dutta, K. y Perry, J. (2006). A tale of tails: An empirical analysis of loss distribution models for estimating operational risk capital. Federal Reserve Bank of Boston, Working Paper No. 06-13.Cortez Samuel. (2022). Introducción a los Métodos de Ensamble y al Algoritmo de XGBoost: Caso Práctico. https://medium.com/@oscars.cortezmo/introducci%C3%B3n-a-los-m%C3%A9todos-de-ensamble-y-al-algoritmo-de-xgboost-caso-pr%C3%A1ctico-e8cb0d58394bEafit. (Sin fecha). ¿QUE ES FRAUDE? https://www.eafit.edu.co/escuelas/administracion/consultorio-contable/Documents/A%20FRAUDE.pdfinstname:Universidad del Rosarioreponame:Repositorio Institucional EdocURFraudeRiesgoMachine learningGrafosPatronesFraudRiskMachine learningGraphsPatternsDetección de fraude bancario en Colombia mediante el análisis de grafosBank Fraud Detection in Colombia through Graph AnalysisbachelorThesisTrabajo de gradoTrabajo de gradohttp://purl.org/coar/resource_type/c_7a1fEscuela de Ingeniería, Ciencia y TecnologíaORIGINALDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdfDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdfapplication/pdf940707https://repository.urosario.edu.co/bitstreams/5a98de86-3876-440f-ba6c-9beb220afc4e/download1b62f50422511c9885988934d6491657MD51LICENSElicense.txtlicense.txttext/plain1483https://repository.urosario.edu.co/bitstreams/d7f02f51-af21-4b66-a13b-9a41a6241970/downloadb2825df9f458e9d5d96ee8b7cd74fde6MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8899https://repository.urosario.edu.co/bitstreams/629e8297-101e-4abc-943d-68b639e7915e/download3b6ce8e9e36c89875e8cf39962fe8920MD53TEXTDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdf.txtDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdf.txtExtracted texttext/plain68859https://repository.urosario.edu.co/bitstreams/7e307d04-9fb3-43cc-9fd0-6ed6fa1d76b8/download5c342459a80f163ddec1aa0973716fb2MD54THUMBNAILDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdf.jpgDeteccion_de_fraude_bancario_en_Colombia_mediante_el_analisis_de_grafos.pdf.jpgGenerated Thumbnailimage/jpeg2881https://repository.urosario.edu.co/bitstreams/43970e9b-d152-416c-8cf1-dec4bc5e1dbe/downloadadc4140b5b4f54a507a21ee5aedc6cb9MD5510336/42296oai:repository.urosario.edu.co:10336/422962024-02-28 03:02:46.315http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttps://repository.urosario.edu.coRepositorio institucional EdocURedocur@urosario.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8gbGEgb2JyYSBlcyBkZSBleGNsdXNpdmEgYXV0b3LDrWEgeSB0aWVuZSBsYSB0aXR1bGFyaWRhZCBzb2JyZSBsYSBtaXNtYS4KPGJyLz4KUEFSQUdSQUZPOiBFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgRUwgQVVUT1IsIGFzdW1pcsOhIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkLCB5IHNhbGRyw6EgZW4gZGVmZW5zYSBkZSBsb3MgZGVyZWNob3MgYXF1w60gYXV0b3JpemFkb3M7IHBhcmEgdG9kb3MgbG9zIGVmZWN0b3MgbGEgdW5pdmVyc2lkYWQgYWN0w7phIGNvbW8gdW4gdGVyY2VybyBkZSBidWVuYSBmZS4KPGhyLz4KRUwgQVVUT1IsIGF1dG9yaXphIGEgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8sICBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBhbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCAgdXRpbGljZSB5IHVzZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuLgoKLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KClBPTElUSUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuIERlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcyBwb3IgcGFydGUgZGUgTEEgVU5JVkVSU0lEQUQgREVMIFJPU0FSSU8gIHBhcmEgZmluZXMgYWNhZMOpbWljb3MgeSBlbiBhcGxpY2FjacOzbiBkZSBjb252ZW5pb3MgY29uIHRlcmNlcm9zIG8gc2VydmljaW9zIGNvbmV4b3MgY29uIGFjdGl2aWRhZGVzIHByb3BpYXMgZGUgbGEgYWNhZGVtaWEsIGNvbiBlc3RyaWN0byBjdW1wbGltaWVudG8gZGUgbG9zIHByaW5jaXBpb3MgZGUgbGV5LiBQYXJhIGVsIGNvcnJlY3RvIGVqZXJjaWNpbyBkZSBtaSBkZXJlY2hvIGRlIGhhYmVhcyBkYXRhICBjdWVudG8gY29uIGxhIGN1ZW50YSBkZSBjb3JyZW8gaGFiZWFzZGF0YUB1cm9zYXJpby5lZHUuY28sIGRvbmRlIHByZXZpYSBpZGVudGlmaWNhY2nDs24gIHBvZHLDqSBzb2xpY2l0YXIgbGEgY29uc3VsdGEsIGNvcnJlY2Npw7NuIHkgc3VwcmVzacOzbiBkZSBtaXMgZGF0b3MuCg==