Aplicación de técnicas de Procesamiento de Lenguaje Natural para el análisis de encuestas de población y su relación con los acuerdos del consenso de Montevideo
El propósito del proyecto es desarrollar una solución que facilite la interpretación y el análisis de la información textual que es recopilada por el Fondo de Población de las Naciones Unidas (UNFPA), para luego traducir esta información al lenguaje de los acuerdos del consenso de Montevideo. Todo e...
- Autores:
-
Céspedes Plata, Jairo Adolfo
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/73111
- Acceso en línea:
- https://hdl.handle.net/1992/73111
- Palabra clave:
- Fondo de Población de las Naciones Unidas
Procesamiento de Lenguaje Natural
Acuerdos del Consenso de Montevideo
Prototipo basado en promedios
Similitud por Coseno
Embedding Contextualizado
Fuzzy C-means
K-means
BETO
Ingeniería
- Rights
- openAccess
- License
- Attribution 4.0 International
Summary: | El propósito del proyecto es desarrollar una solución que facilite la interpretación y el análisis de la información textual que es recopilada por el Fondo de Población de las Naciones Unidas (UNFPA), para luego traducir esta información al lenguaje de los acuerdos del consenso de Montevideo. Todo esto, basado en técnicas de Procesamiento de Lenguaje Natural, a través de diferentes modelos de agrupación como Fuzzy C-means (algoritmo de agrupación difuso), prototipo basado en promedios, similitud por coseno y K means (agrupación), los cuales utilizan el embedding contextualizado como base BETO. Posterior a la prueba de varios modelos se concluyó que la mejor opción es utilizar Kmeans sobre el embedding de los textos, ya que este es el que maximiza la precisión requerida. |
---|