Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales

RESUMEN : Las Administradoras de Riesgos Laborales (ARL) son entidades aseguradoras de vida y cubren riesgos de tipo laboral. Con dependencia en gran parte del recaudo de la cotizaciones que los afiliados realicen, una ARL requiere de una adecuada gestión anticipada de la cartera al predecir qué emp...

Full description

Autores:
Ortega Echeverry, Ivonne
Toro Arrieta, Diana Milena
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/21958
Acceso en línea:
http://hdl.handle.net/10495/21958
https://github.com/anaidg/Seminario-Gestion_Cartera.git
Palabra clave:
Técnicas de predicción
Forecasting
Aprendizaje electrónico
Machine learning
Riesgos ocupacionales
Gestión de cartera
Administradoras de Riesgos Laborales (ARL)
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_24057
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id UDEA2_f5b7750bee9572e2195965ac8c319f6f
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/21958
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
title Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
spellingShingle Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
Técnicas de predicción
Forecasting
Aprendizaje electrónico
Machine learning
Riesgos ocupacionales
Gestión de cartera
Administradoras de Riesgos Laborales (ARL)
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_24057
title_short Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
title_full Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
title_fullStr Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
title_full_unstemmed Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
title_sort Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laborales
dc.creator.fl_str_mv Ortega Echeverry, Ivonne
Toro Arrieta, Diana Milena
dc.contributor.advisor.none.fl_str_mv Serna Buitrago, Daniela
dc.contributor.author.none.fl_str_mv Ortega Echeverry, Ivonne
Toro Arrieta, Diana Milena
dc.subject.agrovoc.none.fl_str_mv Técnicas de predicción
Forecasting
Aprendizaje electrónico
Machine learning
Riesgos ocupacionales
topic Técnicas de predicción
Forecasting
Aprendizaje electrónico
Machine learning
Riesgos ocupacionales
Gestión de cartera
Administradoras de Riesgos Laborales (ARL)
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_24057
dc.subject.proposal.spa.fl_str_mv Gestión de cartera
Administradoras de Riesgos Laborales (ARL)
dc.subject.agrovocuri.none.fl_str_mv http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_24057
description RESUMEN : Las Administradoras de Riesgos Laborales (ARL) son entidades aseguradoras de vida y cubren riesgos de tipo laboral. Con dependencia en gran parte del recaudo de la cotizaciones que los afiliados realicen, una ARL requiere de una adecuada gestión anticipada de la cartera al predecir qué empresas afiliadas a la ARL tendrán mayor probabilidad de quedar en estado de mora durante el mes inmediatamente posterior a la consulta. Los datos empleados son anonimizados para proteger la identidad de la ARL en estudio y, se incluye información pre-pandemia y pandemia, dado que por efectos de la COVID-19, las empresas tienen comportamientos atípicos a los esperados en años anteriores. En la fase de preprocesamiento, se realiza el respectivo tratamiento sobre los datos nulos y los datos tipo fecha. En la fase de implementación y ejecución de modelos, se genera una línea base (o baseline) sin ajuste de hiperparametros o adición de técnicas de ingeniería de características; posteriormente, se programan y ejecutan varios algoritmos de Machine Learning, buscando los mejores hiperparametros del modelo que, junto con la implementación de técnicas para el tratamiento de datos desbalanceados, permitirán mejorar el desempeño del modelo obtenido como baseline. Se toma el resultado del algoritmo Easy Ensemble como baseline, dado que a pesar de que dicho modelo presenta un score de precisión bajo en esta etapa, también es el que menos se equivoca en la clasificación, según muestra su matriz de confusión. En la búsqueda de hiperparametros, se encuentra que el algoritmo Random Forest, con un score de precisión de 70%, logra clasificar mejor las muestras. Adicionalmente, se tiene que la generación de muestras sintéticas solo logran desmejorar el resultado obtenido por la mejor combinación de hiperparametros encontrados con el método grid Search, en el paso anterior.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-08-27T21:35:20Z
dc.date.available.none.fl_str_mv 2021-08-27T21:35:20Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/draft
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/21958
dc.identifier.url.spa.fl_str_mv https://github.com/anaidg/Seminario-Gestion_Cartera.git
url http://hdl.handle.net/10495/21958
https://github.com/anaidg/Seminario-Gestion_Cartera.git
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.accessrights.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.extent.spa.fl_str_mv 30
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.place.spa.fl_str_mv Medellín
institution Universidad de Antioquia
bitstream.url.fl_str_mv http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/6/OrtegaIvonneToroDiana_2021_GestionCarteraARL.pdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/7/license_rdf
http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/8/license.txt
bitstream.checksum.fl_str_mv bd86c496fcf758d08bda10f2920543a9
e2060682c9c70d4d30c83c51448f4eed
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Antioquia
repository.mail.fl_str_mv andres.perez@udea.edu.co
_version_ 1812173218272772096
spelling Serna Buitrago, DanielaOrtega Echeverry, IvonneToro Arrieta, Diana Milena2021-08-27T21:35:20Z2021-08-27T21:35:20Z2021http://hdl.handle.net/10495/21958https://github.com/anaidg/Seminario-Gestion_Cartera.gitRESUMEN : Las Administradoras de Riesgos Laborales (ARL) son entidades aseguradoras de vida y cubren riesgos de tipo laboral. Con dependencia en gran parte del recaudo de la cotizaciones que los afiliados realicen, una ARL requiere de una adecuada gestión anticipada de la cartera al predecir qué empresas afiliadas a la ARL tendrán mayor probabilidad de quedar en estado de mora durante el mes inmediatamente posterior a la consulta. Los datos empleados son anonimizados para proteger la identidad de la ARL en estudio y, se incluye información pre-pandemia y pandemia, dado que por efectos de la COVID-19, las empresas tienen comportamientos atípicos a los esperados en años anteriores. En la fase de preprocesamiento, se realiza el respectivo tratamiento sobre los datos nulos y los datos tipo fecha. En la fase de implementación y ejecución de modelos, se genera una línea base (o baseline) sin ajuste de hiperparametros o adición de técnicas de ingeniería de características; posteriormente, se programan y ejecutan varios algoritmos de Machine Learning, buscando los mejores hiperparametros del modelo que, junto con la implementación de técnicas para el tratamiento de datos desbalanceados, permitirán mejorar el desempeño del modelo obtenido como baseline. Se toma el resultado del algoritmo Easy Ensemble como baseline, dado que a pesar de que dicho modelo presenta un score de precisión bajo en esta etapa, también es el que menos se equivoca en la clasificación, según muestra su matriz de confusión. En la búsqueda de hiperparametros, se encuentra que el algoritmo Random Forest, con un score de precisión de 70%, logra clasificar mejor las muestras. Adicionalmente, se tiene que la generación de muestras sintéticas solo logran desmejorar el resultado obtenido por la mejor combinación de hiperparametros encontrados con el método grid Search, en el paso anterior.ABSTRACT : The Labor Risk Administrators (ARL) are life insurance entities and cover occupational risks. Relying to a large extent on the collection of contributions made by affiliates, an ARL requires adequate early management of the portfolio by predicting which companies affiliated with the ARL will be more likely to be in default during the month immediately after the loan. query. The data used is anonymized to protect the identity of the ARL under study and, pre-pandemic and pandemic information is included, given that due to the effects of COVID-19, companies have atypical behaviors to those expected in previous years. In the preprocessing phase, the respective treatment is carried out on the null data and the date type data. In the model implementation and execution phase, a baseline (or baseline) is generated without hyperparameter adjustment or addition of feature engineering techniques; Subsequently, several Machine Learning algorithms are programmed and executed, looking for the best hyperparameters of the model that, together with the implementation of techniques for the treatment of unbalanced data, will allow to improve the performance of the model obtained as a baseline. The result of the Easy Ensemble algorithm is taken as the baseline, since even though this model has a low precision score at this stage, it is also the one that makes the least mistakes in the classification, as shown by its confusion matrix. In the search for hyperparameters, it is found that the Random Forest algorithm, with a precision score of 70%, manages to better classify the samples. Additionally, the generation of synthetic samples only manages to deteriorate the result obtained by the best combination of hyperparameters found with the grid Search method, in the previous step.30application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/otherhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/Modelo predictivo para el apoyo a la gestión de la cartera de empresa administradora de riesgos laboralesMedellínTécnicas de predicciónForecastingAprendizaje electrónicoMachine learningRiesgos ocupacionalesGestión de carteraAdministradoras de Riesgos Laborales (ARL)http://aims.fao.org/aos/agrovoc/c_3041http://aims.fao.org/aos/agrovoc/c_49834http://aims.fao.org/aos/agrovoc/c_24057Especialista en Analítica y Ciencia de DatosEspecializaciónFacultad de Ingeniería. Especialización en Analítica y Ciencia de DatosUniversidad de AntioquiaORIGINALOrtegaIvonneToroDiana_2021_GestionCarteraARL.pdfOrtegaIvonneToroDiana_2021_GestionCarteraARL.pdfTrabajo de grado de especializaciónapplication/pdf1775584http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/6/OrtegaIvonneToroDiana_2021_GestionCarteraARL.pdfbd86c496fcf758d08bda10f2920543a9MD56CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/7/license_rdfe2060682c9c70d4d30c83c51448f4eedMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://bibliotecadigital.udea.edu.co/bitstream/10495/21958/8/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5810495/21958oai:bibliotecadigital.udea.edu.co:10495/219582021-08-27 16:35:52.307Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=