Control de intersecciones semaforizadas aplicando aprendizaje por refuerzo multiagente
En este documento se describe el diseño de metodologías de aprendizaje por refuerzo multiagente para el control adaptativo de la semaforización, con el objetivo de reducir el tiempo de espera de los vehículos y la longitud de cola en las intersecciones. Para ello se utilizan dos Métodos de coordinac...
- Autores:
-
Higuera Arias, Carolina
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/13675
- Acceso en línea:
- http://hdl.handle.net/1992/13675
- Palabra clave:
- Procesamiento de señales - Investigaciones
Sistemas multiagente - Investigaciones
Semáforos - Investigaciones - Investigaciones
Reguladores electrónicos de tránsito
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Summary: | En este documento se describe el diseño de metodologías de aprendizaje por refuerzo multiagente para el control adaptativo de la semaforización, con el objetivo de reducir el tiempo de espera de los vehículos y la longitud de cola en las intersecciones. Para ello se utilizan dos Métodos de coordinación de acciones entre agentes, el primero se basa en grafos de coordinación (Q VE), dado que la función de recompensa puede ser descompuesta en contribuciones por agente; en este enfoque, la obtención de la acción conjunta se logra con el algoritmo de eliminación de variable. El segundo método (Q-BR) explota el principio de localidad de los agentes, en donde la acción corresponde a la best response de un juego de dos jugadores con cada miembro de su vecindad |
---|