Prototipo para análisis y clasificación de incidentes en una entidad financiera utilizando NPL

El área de auditoría interna de una entidad financiera se ha venido enfrentando a diversos desafíos a raíz de la falta de eficacia para llevar a cabo la clasificación de incidentes en los procesos sujetos a auditoría. Estas fallas han obstaculizado la toma de decisiones basadas en datos y ha llevado...

Full description

Autores:
Restrepo Cifuentes, Juan David
Velasco Gómez, Guiancarlo Javier
Tipo de recurso:
Masters Thesis
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2038
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2038
Palabra clave:
Gestión de incidentes
Inteligencia artificial
Lenguaje de texto
Base de datos
Auditoría basada en datos
Lenguaje natural
Rights
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:El área de auditoría interna de una entidad financiera se ha venido enfrentando a diversos desafíos a raíz de la falta de eficacia para llevar a cabo la clasificación de incidentes en los procesos sujetos a auditoría. Estas fallas han obstaculizado la toma de decisiones basadas en datos y ha llevado al incumplimiento de los acuerdos de nivel de servicio (ANS), resultando en el cierre de incidencias sin una solución adecuada. En el marco del trabajo de grado, se propuso desarrollar un prototipo para el análisis y clasificación de incidentes en una entidad financiera utilizando el Procesamiento de Lenguaje Natural (PLN). Para abordar esta problemática, se decidió crear una aplicación de Machine Learning que pudiera clasificar los incidentes de la mesa de servicio de acuerdo con su prioridad. Para lograr este objetivo, fue necesario llevar a cabo un proceso de limpieza de las descripciones de los incidentes, eliminando palabras irrelevantes que no aportaban al contexto y al significado de cada incidente. A continuación, se adaptaron y vectorizaron los datos textuales para que fueran fáciles de procesar por los modelos de clasificación. Posteriormente, se evaluaron las métricas de diferentes modelos y se seleccionaron los mejores, optimizando sus hiperparámetros y probando su capacidad de predicción utilizando registros de incidentes diferentes a los utilizados en el entrenamiento. Como resultado, se presentaron a la entidad financiera dos modelos con TF-IDF que habían sido optimizados y mostraban una precisión superior al 80%. Sin embargo, al probar los modelos con registros distintos a los utilizados en el entrenamiento, se observaron diferencias en la clasificación de hasta el 19%. Es importante destacar que esta discrepancia no implica que el modelo esté equivocado en la clasificación, sino que invita al personal del banco a validar los incidentes en los cuales difiere de la prioridad asignada manualmente por los colaboradores de la entidad financiera.