Multi-agent reinforcement learning, theory and application

Actualmente las metodologías relacionadas con machine learning han tenido un gran auge dentro del desarrollo de proyectos, y se están abriendo un camino en la solución de problemas de la vida diaria. Pero en muchos casos se están implementando a problemas en donde se utilizan métodos matemáticos ant...

Full description

Autores:
Vargas Panesso, José Vicente
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/59191
Acceso en línea:
http://hdl.handle.net/1992/59191
Palabra clave:
Reinforcement learning
Teoría de juegos
Asignación dinámica de recursos
Replicators dynamics
Multi-agent reinforcement learning
Ingeniería
Rights
openAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Description
Summary:Actualmente las metodologías relacionadas con machine learning han tenido un gran auge dentro del desarrollo de proyectos, y se están abriendo un camino en la solución de problemas de la vida diaria. Pero en muchos casos se están implementando a problemas en donde se utilizan métodos matemáticos antiguos que se han venido desarrollando por muchos años. Específicamente, en este trabajo se tratará la metodología de Multi-agent Reinforcement learning, la cual es una rama del Reinforcement learning en la cual un agente no aprende su comportamiento sobre un ambiente estático, sino sobre un ambiente variante en relación a decisiones tomadas por otros agentes. Es este comportamiento el que lo vuelve un sistema muy parecido a un population game, en el cual distintos agentes deben interactuar entre sí con el objetivo de llegar a una decisión óptima para cada uno, o el denominado equilibrio de Nash. Es debido a estas similitudes de conceptos y de propósito, que en este trabajo se compararan algunos de los comportamientos esenciales de estas metodologías, para poder apreciar sus diferencias de comportamiento, sus conjunciones, y más aún los posibles elementos que cada una le puede llegar a ofrecer a la otra.