Aplicación de técnicas de Procesamiento de Lenguaje Natural para el análisis de encuestas de población y su relación con los acuerdos del consenso de Montevideo

El propósito del proyecto es desarrollar una solución que facilite la interpretación y el análisis de la información textual que es recopilada por el Fondo de Población de las Naciones Unidas (UNFPA), para luego traducir esta información al lenguaje de los acuerdos del consenso de Montevideo. Todo e...

Full description

Autores:
Céspedes Plata, Jairo Adolfo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/73111
Acceso en línea:
https://hdl.handle.net/1992/73111
Palabra clave:
Fondo de Población de las Naciones Unidas
Procesamiento de Lenguaje Natural
Acuerdos del Consenso de Montevideo
Prototipo basado en promedios
Similitud por Coseno
Embedding Contextualizado
Fuzzy C-means
K-means
BETO
Ingeniería
Rights
openAccess
License
Attribution 4.0 International
Description
Summary:El propósito del proyecto es desarrollar una solución que facilite la interpretación y el análisis de la información textual que es recopilada por el Fondo de Población de las Naciones Unidas (UNFPA), para luego traducir esta información al lenguaje de los acuerdos del consenso de Montevideo. Todo esto, basado en técnicas de Procesamiento de Lenguaje Natural, a través de diferentes modelos de agrupación como Fuzzy C-means (algoritmo de agrupación difuso), prototipo basado en promedios, similitud por coseno y K means (agrupación), los cuales utilizan el embedding contextualizado como base BETO. Posterior a la prueba de varios modelos se concluyó que la mejor opción es utilizar Kmeans sobre el embedding de los textos, ya que este es el que maximiza la precisión requerida.