Diseño de un Modelo matemático para la predicción de fuga de clientes en el área de telefonía

Hoy en día, debido a la necesidad de estar comunicados telefónicamente y a la gran cantidad de empresas que ofrecen este servicio en Colombia, la telefonía móvil enfrenta una feroz competencia por retener usuarios, buscando evitar la fuga de sus clientes a otras entidades y no incurrir en costos adi...

Full description

Autores:
Camargo Ramos, Juan José
Morales Cotes, Eduardo Alberto
Orozco Polo, Ivan Andrés
Tipo de recurso:
Fecha de publicación:
2020
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/8881
Acceso en línea:
http://hdl.handle.net/10584/8881
Palabra clave:
Fuga
Clientes
Técnicas Clasificadoras
Minería de datos
Variables Explicativas
Customers
Classificatory Techniques
Data mining
Explanatory Variables
Churn
Rights
License
Universidad del Norte
Description
Summary:Hoy en día, debido a la necesidad de estar comunicados telefónicamente y a la gran cantidad de empresas que ofrecen este servicio en Colombia, la telefonía móvil enfrenta una feroz competencia por retener usuarios, buscando evitar la fuga de sus clientes a otras entidades y no incurrir en costos adicionales al tratar de atraer a nuevos clientes. Por lo que es de suma importancia para las empresas de este sector, el predecir si un usuario abandonará sus servicios. Como solución a esta problemática, se propone el diseño de modelos matemáticos que predigan intención de fuga de clientes mediante el uso de técnicas clasificadoras de minería de datos (Naïve Bayes, Random Forest, Redes Neuronales y Regresión Logística). Para ello, se recurrió a una base de datos históricos perteneciente a una empresa de telefonía, la cual contenía información de tipo demográfica y conductual de alrededor de 7000 clientes. Así, luego de analizar y tratar estos datos, fue posible determinar las variables explicativas y su respectivo impacto sobre la variable respuesta. Posteriormente tales variables servirían como entrada para el diseño de los modelos mediante el software R. Finalmente, se evaluó el desempeño de cada uno de los modelos propuestos, al aplicar el análisis ROC (Receiver Operating Characteristic) tanto para la fase de entrenamiento como para la de validación. Reflejando, que aún con presencia de sobreajuste en esta última etapa, los modelos de Random Forest y de Redes Neuronales resultaron ser significativos, dado a que el valor de la exactitud en ambos casos (77.76% y 76,7% respectivamente) fue mayor al No Information Rate (NIR) de los datos, a diferencia de los otros modelos que no lo fueron. Lo que indica que estas dos técnicas, muestran ser alternativas atractivas para emplearlas al seguimiento de clientes y disminuir cifras de fuga.