Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un compo...

Full description

Autores:
Daza, Eduardo
Tipo de recurso:
Fecha de publicación:
2001
Institución:
Universidad del Magdalena
Repositorio:
Repositorio Unimagdalena
Idioma:
spa
OAI Identifier:
oai:repositorio.unimagdalena.edu.co:123456789/2406
Acceso en línea:
http://repositorio.unimagdalena.edu.co/handle/123456789/2406
Palabra clave:
Reinforcement learning
Multi-Agent Systems
IS-00001
Rights
restrictedAccess
License
atribucionnocomercialsinderivar
Description
Summary:El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un comportamiento óptimo para evaluar el desempeño de los agentes. Usando lenguaje C++, fue desarrollado para plataforma Linux, el software Pcc, el cual simula las competencias en una pista virtual de carreras y entrega de manera gráfica los resultados del aprendizaje. Se usó el algoritmo SARSA(lambda) con selección de acciones E-greedy en ambos agentes y se corrió la aplicación en ocho escenarios de prueba. Los resultados mostraron el alcance de un comportamiento óptimo en todos los escenarios para ambos agentes. El ambiente discreto, estocástico y parcialmente observable empleado y la co-evolución competitiva lograda y la herramienta de software libre producida, hacen de este trabajo una importante contribución al las investigaciones en aprendizaje de máquina.