¿Cómo puede contribuir el Machine Learning a la focalización de programas sociales?. Modelo XGBoost para la determinación de pobreza monetaria interpretado mediante Shap Values: Caso Colombia 2019-2020

La implementación de programas de ayuda social ha sido la principal estrategia llevada a cabo por los gobiernos latinoamericanos para mitigar el impacto de la pobreza y el desempleo. Estos programas incluyen subsidios y transferencias de recursos condicionadas que buscan mejorar la situación económi...

Full description

Autores:
Galvis Caballero, Ángel
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/16448
Acceso en línea:
http://hdl.handle.net/20.500.12749/16448
Palabra clave:
Economic development
Economy
Economic analysis
Proxy means tests
Machine learning
Interpretable machine learning
Methods Assembly and Shap values
Artificial intelligence
Machine theory
Explanation-Based Learning
Análisis económico
Economía
Desarrollo económico
Inteligencia artificial
Teoría de las máquinas
Aprendizaje basado en explicaciones
Pruebas de medios proxy
Aprendizaje automático
Aprendizaje automático interpretable
Métodos valores de ensamble y Shap
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Description
Summary:La implementación de programas de ayuda social ha sido la principal estrategia llevada a cabo por los gobiernos latinoamericanos para mitigar el impacto de la pobreza y el desempleo. Estos programas incluyen subsidios y transferencias de recursos condicionadas que buscan mejorar la situación económica de los hogares fomentado: la permanencia educativa, el acceso a la salud, la obtención de vivienda, la adquisición de una canasta básica de alimentos, etc. Debido a que estos programas tienen presupuestos limitados se han diseñado métodos para enfocar la inversión pública en poblaciones específicas, por ejemplo: los hogares cuyos ingresos son menores a la línea de pobreza monetaria. En el presente trabajo se utiliza el modelo de machine learning conocido como XGBoost (Chen, T., 2016) para predecir diferentes condiciones económicas en individuos. Entre estas, el nivel de ingresos, la condición de pobreza y la situación desempleo, a partir de características como: el genero, el número de personas en el hogar, los años de educación, las características de la vivienda, los bienes y posesiones, el estrato socioeconómico, entre otras. Permitiendo establecer un proxy que determine si cumplen con condiciones de acceso para ser beneficiarios potenciales programas sociales. El desempeño del modelo es satisfactorio en la estimación de ingresos, presentando errores de inclusión del 23% al 27%, que son inferiores a los presentados por el agregado de ayudas institucionales a nivel Colombia que se estimó en un rango de error entre el 51.8% al 58%. Por último, se aplicó la técnica Shap (SHapley Additive exPlanations) (Lundberg, S. 2017) para explicar la forma en la que se correlacionan las características que se utilizaron en los modelos predictivos y el índice de ingresos. Esto facilita proponer una aplicación de este tipo de técnica como soporte para la operación de programas sociales focalizados, pues permite que la toma de decisiones basada en algoritmos sea más transparente y auditable.