Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo

EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje in...

Full description

Autores:
Gómez Garzón, Nicolás David
Peña Castro, Néstor Harbey
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/46788
Acceso en línea:
http://hdl.handle.net/11634/46788
Palabra clave:
Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado.