Métodos de optimización en inferencia variacional de campo medio con un enfoque en transporte óptimo sobre subconjuntos poliédricos en el espacio de Wasserstein

La inferencia variacional (VI) aborda la aproximación de distribuciones complejas mediante la optimización de medidas aproximadas dentro de estructuras no paramétricas, minimizando la divergencia de Kullback-Leibler. Este trabajo se centra en la inferencia variacional de campo medio (MFVI), tradicio...

Full description

Autores:
Arias Russi, Andrés Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/75955
Acceso en línea:
https://hdl.handle.net/1992/75955
Palabra clave:
Optimal transport
Variational inference
Mean-field variational inference
Latent and observable variables
Generative models
Wasserstein space
Matemáticas
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Description
Summary:La inferencia variacional (VI) aborda la aproximación de distribuciones complejas mediante la optimización de medidas aproximadas dentro de estructuras no paramétricas, minimizando la divergencia de Kullback-Leibler. Este trabajo se centra en la inferencia variacional de campo medio (MFVI), tradicionalmente vinculada a supuestos paramétricos, pero aquí reformulada en un marco no paramétrico usando técnicas de transporte óptimo en espacios de Wasserstein. Siguiendo enfoques innovadores basados en transporte óptimo, construimos mapas de transporte en conjuntos poliédricos para aproximar la distribución objetivo sobre medidas producto independientes, sin imponer restricciones paramétricas en la forma de las distribuciones. Nuestro objetivo es analizar un algoritmo basado en optimización poliédrica, evaluando su eficacia teórica y práctica para resolver problemas variacionales en alta dimensión. El estudio explora la interacción entre geometría de transporte óptimo, escalabilidad computacional y generalización no paramétrica, aportando fundamentos teóricos y perspectivas aplicadas para abordar desafíos de inferencia en escenarios complejos.