Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos
La minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en...
- Autores:
-
González Martínez, Edwin Fernando
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2018
- Institución:
- Universidad Santo Tomás
- Repositorio:
- Repositorio Institucional USTA
- Idioma:
- spa
- OAI Identifier:
- oai:repository.usta.edu.co:11634/12529
- Acceso en línea:
- http://repository.usta.edu.co/handle/11634/12529
- Palabra clave:
- Statistics
Data Mining
Algorithms
Fraud
Patterns
Credit cards
Machine learning
Estadística
Minería de datos
Algoritmos
Fraude con tarjetas de crédito
Aprendizaje Automático
Patrones
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 2.5 Colombia
Summary: | La minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en inglés, es un campo de la estadística y ciencias de la computación que emplea diversas técnicas y metodologías para el proceso de identificar patrones valiosos en la extracción de la información nueva, útil y novedosa; una de las etapas más importantes es el data mining, donde se realiza la estimación de los parámetros de los modelos probabilísticos como son las redes neuronales, random forest, naive bayes, máquinas de soporte vectorial, modelos lineales generalizados logit, probit y log log; posteriormente serán evaluados y analizados con las métricas de clasificación accuracy, precisión, recall, f beta score y curva roc. El fraude se define como la acción contraria a la verdad y a la rectitud, que perjudica a la persona o entidad contra quien se comete, esto conlleva a pérdidas económicas y problemas legales; hay diferentes tipos de fraude, como son intruso a redes privadas, tarjeta de crédito, telecomunicaciones y lavado de activos. Este trabajo busca comparar la eficiencia de los modelos probabilísticos de la minería de datos, machine learning y los modelos lineales generalizados para ser aplicados a las transacciones con tarjeta de crédito y evaluar con las métricas de clasificación que modelo probabilístico es eficiente en la detección de predecir el fraude. |
---|