Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente

En este documento se describe el diseño de metodologías de aprendizaje por refuerzo multiagente para el control adaptativo de la semaforización, con el objetivo de reducir el tiempo de espera de los vehículos y la longitud de cola en las intersecciones. Para ello se utilizan dos Métodos de coordinac...

Full description

Autores:
Higuera Arias, Carolina
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/13675
Acceso en línea:
http://hdl.handle.net/1992/13675
Palabra clave:
Procesamiento de señales - Investigaciones
Sistemas multiagente - Investigaciones
Semáforos - Investigaciones - Investigaciones
Reguladores electrónicos de tránsito
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Description
Summary:En este documento se describe el diseño de metodologías de aprendizaje por refuerzo multiagente para el control adaptativo de la semaforización, con el objetivo de reducir el tiempo de espera de los vehículos y la longitud de cola en las intersecciones. Para ello se utilizan dos Métodos de coordinación de acciones entre agentes, el primero se basa en grafos de coordinación (Q VE), dado que la función de recompensa puede ser descompuesta en contribuciones por agente; en este enfoque, la obtención de la acción conjunta se logra con el algoritmo de eliminación de variable. El segundo método (Q-BR) explota el principio de localidad de los agentes, en donde la acción corresponde a la best response de un juego de dos jugadores con cada miembro de su vecindad