Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos

La minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en...

Full description

Autores:
González Martínez, Edwin Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/12529
Acceso en línea:
http://repository.usta.edu.co/handle/11634/12529
Palabra clave:
Statistics
Data Mining
Algorithms
Fraud
Patterns
Credit cards
Machine learning
Estadística
Minería de datos
Algoritmos
Fraude con tarjetas de crédito
Aprendizaje Automático
Patrones
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:La minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en inglés, es un campo de la estadística y ciencias de la computación que emplea diversas técnicas y metodologías para el proceso de identificar patrones valiosos en la extracción de la información nueva, útil y novedosa; una de las etapas más importantes es el data mining, donde se realiza la estimación de los parámetros de los modelos probabilísticos como son las redes neuronales, random forest, naive bayes, máquinas de soporte vectorial, modelos lineales generalizados logit, probit y log log; posteriormente serán evaluados y analizados con las métricas de clasificación accuracy, precisión, recall, f beta score y curva roc. El fraude se define como la acción contraria a la verdad y a la rectitud, que perjudica a la persona o entidad contra quien se comete, esto conlleva a pérdidas económicas y problemas legales; hay diferentes tipos de fraude, como son intruso a redes privadas, tarjeta de crédito, telecomunicaciones y lavado de activos. Este trabajo busca comparar la eficiencia de los modelos probabilísticos de la minería de datos, machine learning y los modelos lineales generalizados para ser aplicados a las transacciones con tarjeta de crédito y evaluar con las métricas de clasificación que modelo probabilístico es eficiente en la detección de predecir el fraude.