Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales

RESUMEN : Las Administradoras de Riesgos Laborales (ARL) son entidades aseguradoras de vida y cubren riesgos de tipo laboral. Con dependencia en gran parte del recaudo de la cotizaciones que los afiliados realicen, una ARL requiere de una adecuada gestión anticipada de la cartera al predecir qué emp...

Full description

Autores:
Ortega Echeverry, Ivonne
Toro Arrieta, Diana Milena
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/21958
Acceso en línea:
http://hdl.handle.net/10495/21958
https://github.com/anaidg/Seminario-Gestion_Cartera.git
Palabra clave:
Técnicas de predicción
Forecasting
Aprendizaje electrónico
Machine learning
Riesgos ocupacionales
Gestión de cartera
Administradoras de Riesgos Laborales (ARL)
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_24057
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : Las Administradoras de Riesgos Laborales (ARL) son entidades aseguradoras de vida y cubren riesgos de tipo laboral. Con dependencia en gran parte del recaudo de la cotizaciones que los afiliados realicen, una ARL requiere de una adecuada gestión anticipada de la cartera al predecir qué empresas afiliadas a la ARL tendrán mayor probabilidad de quedar en estado de mora durante el mes inmediatamente posterior a la consulta. Los datos empleados son anonimizados para proteger la identidad de la ARL en estudio y, se incluye información pre-pandemia y pandemia, dado que por efectos de la COVID-19, las empresas tienen comportamientos atípicos a los esperados en años anteriores. En la fase de preprocesamiento, se realiza el respectivo tratamiento sobre los datos nulos y los datos tipo fecha. En la fase de implementación y ejecución de modelos, se genera una línea base (o baseline) sin ajuste de hiperparametros o adición de técnicas de ingeniería de características; posteriormente, se programan y ejecutan varios algoritmos de Machine Learning, buscando los mejores hiperparametros del modelo que, junto con la implementación de técnicas para el tratamiento de datos desbalanceados, permitirán mejorar el desempeño del modelo obtenido como baseline. Se toma el resultado del algoritmo Easy Ensemble como baseline, dado que a pesar de que dicho modelo presenta un score de precisión bajo en esta etapa, también es el que menos se equivoca en la clasificación, según muestra su matriz de confusión. En la búsqueda de hiperparametros, se encuentra que el algoritmo Random Forest, con un score de precisión de 70%, logra clasificar mejor las muestras. Adicionalmente, se tiene que la generación de muestras sintéticas solo logran desmejorar el resultado obtenido por la mejor combinación de hiperparametros encontrados con el método grid Search, en el paso anterior.