Clasificación de árboles de problemas para la formulación de proyectos sociales

El proyecto tiene como objetivo desarrollar una prueba de concepto para realizar la validación de árboles de problemas formulados bajo la Metodología del Marco Lógico a través de técnicas basadas en el Procesamiento de Lenguaje Natural. Esta tarea es relevante dentro del marco del diseño de política...

Full description

Autores:
Tipo de recurso:
masterThesis
Fecha de publicación:
2022
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/58394
Acceso en línea:
http://hdl.handle.net/10554/58394
https://doi.org/10.11144/Javeriana.10554.58394
Palabra clave:
Transformadores
Clasificación de oraciones
Árbol de problemas
Metodología del marco lógico
Similitud semántica
Reconocimiento de entidades nombradas
Departamento Nacional de Planeación
Procesamiento de lenguaje natural
Transformers
Text classification
Problem trees
Logical framework approach
Semantic similarity
Named entity recognition
Department of national planning
Natural language processing
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicas
Lógica computacional
Semántica
Análisis de datos
Lenguaje natural (Informática)
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
Description
Summary:El proyecto tiene como objetivo desarrollar una prueba de concepto para realizar la validación de árboles de problemas formulados bajo la Metodología del Marco Lógico a través de técnicas basadas en el Procesamiento de Lenguaje Natural. Esta tarea es relevante dentro del marco del diseño de políticas públicas, pues el proceso de validación es difícil y costoso, dados los elementos transdisciplinarios y sistémicos que involucran a profesionales de múltiples disciplinas, así como intereses particulares. Para lograr este objetivo, se utilizó un repositorio de árboles de problemas correspondiente a proyectos de inversión reales y aprobados por el Departamento Nacional de Planeación, los cuales estaban etiquetados como causa, problema, efecto u otro. A partir de este conjunto de datos, se realizó un proceso de minería de datos con el fin de realizar las siguientes tareas: clasificación de oraciones (causa, problema, efecto u otra), reconocimiento de entidades nombradas y similitud semántica (problema - causa/efecto). Como principal hallazgo la prueba de concepto arroja la pertinencia de modelos de lenguaje basados en transformadores en español (BETO) para las tareas de clasificación de oraciones y similitud semántica. Mientras que para el reconocimiento de entidades nombradas se recomienda el uso de un modelo sobre ajustado FLERT. Finalmente, se realizó un modelo de aceptación tecnológica junto a un panel de expertos, con el fin de corroborar la idoneidad de la solución analítica propuesta para la formulación de proyectos sociales.