Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning

Este proyecto de grado se ocupa del problema de navegacion autónoma en 3D por medio de aprendizaje por refuerzo profundo (DRL por sus siglas en ingles), empleando específicamente el algoritmo de DQN(Deep QLearning)[1], para cinco drones simulados en un ambiente parcialmente observable por medio de s...

Full description

Autores:
Valdelamar Martelo, Álvaro Ramón
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/55697
Acceso en línea:
http://hdl.handle.net/1992/55697
Palabra clave:
Deep Qlearning
Navegación autónoma
Navegación sin mapa
Evasión de obstáculos
Aprendizaje por refuerzo
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_0333461250f297472fc622e6d0276e00
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/55697
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
title Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
spellingShingle Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
Deep Qlearning
Navegación autónoma
Navegación sin mapa
Evasión de obstáculos
Aprendizaje por refuerzo
Ingeniería
title_short Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
title_full Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
title_fullStr Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
title_full_unstemmed Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
title_sort Formación de patrones por movimiento autónomo a través de algoritmos de Deep QLearning
dc.creator.fl_str_mv Valdelamar Martelo, Álvaro Ramón
dc.contributor.advisor.none.fl_str_mv García Cárdenas, Juan José
Lozano Martínez, Fernando Enrique
dc.contributor.author.spa.fl_str_mv Valdelamar Martelo, Álvaro Ramón
dc.contributor.jury.spa.fl_str_mv Segura Quijano, Fredy Enrique
dc.subject.keyword.none.fl_str_mv Deep Qlearning
Navegación autónoma
Navegación sin mapa
Evasión de obstáculos
Aprendizaje por refuerzo
topic Deep Qlearning
Navegación autónoma
Navegación sin mapa
Evasión de obstáculos
Aprendizaje por refuerzo
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Este proyecto de grado se ocupa del problema de navegacion autónoma en 3D por medio de aprendizaje por refuerzo profundo (DRL por sus siglas en ingles), empleando específicamente el algoritmo de DQN(Deep QLearning)[1], para cinco drones simulados en un ambiente parcialmente observable por medio de sensores ultrasonicos. En este proyecto se implementó una estructura básica de enjambre[2] evaluando la capacidad de aprendizaje de un solo dron en un mapa con obstaculos dinámicos. Es decir, se implementó una estructura vainilla de aprendizaje por refuerzo para un unico agente, la cual se replicó para cinco drones a través de un control centralizado. El ambiente de aprendizaje fue realizado en el simluador Coppeliasim[3], el cual fue conectado por medio de la API (interfaz de programacion de aplicaciones) remota de Python con la librería Stable.Baselines3[4], la cual ofrece una implementacion de código abierto para el algoritmo DQN. Se entrenó dos modelos de agentes, uno para un ambiente con ´ obstaculos estáticos y otro para obstáculos dinámicos, sobre ´ los cuales se les hizo distintas pruebas para llegar a distintos objetivos desde varios puntos iniciales. Se obtuvieron resultados positivos con distintos porcentajes de exitos tanto en la ´ operacion de un solo dron, tanto como para la formación de cinco patrones distintos en el modelo dinamico empleando cinco drones. Demostracion de los resultados puede verse en este enlace https://youtu.be/hzlIE LR3Fk
publishDate 2021
dc.date.issued.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2022-02-22T20:10:36Z
dc.date.available.none.fl_str_mv 2022-02-22T20:10:36Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/55697
dc.identifier.pdf.spa.fl_str_mv 25803.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/55697
identifier_str_mv 25803.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 11 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de los Andes
dc.publisher.program.spa.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería
dc.publisher.department.spa.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/2ca78f80-de5e-4a17-ade2-688316c0a15d/download
https://repositorio.uniandes.edu.co/bitstreams/8ccf654d-df92-4217-882f-7b24b6cdb15d/download
https://repositorio.uniandes.edu.co/bitstreams/ce1bdaf9-794d-48a0-a347-ae3a55441af6/download
bitstream.checksum.fl_str_mv 3aef75a51e50c7be79139d73483abd97
888bf54e43842cb22688cb0f7cf668c8
1836ec3d675410cebbb8721eedf099e0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1808390483582386176
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2García Cárdenas, Juan José4206bdff-0bdc-42b5-9c6d-691e503363a8400Lozano Martínez, Fernando Enriquevirtual::16201-1Valdelamar Martelo, Álvaro Ramónb6ba2cbf-cb19-4d6b-bcb4-8067ef89a020500Segura Quijano, Fredy Enrique2022-02-22T20:10:36Z2022-02-22T20:10:36Z2021http://hdl.handle.net/1992/5569725803.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este proyecto de grado se ocupa del problema de navegacion autónoma en 3D por medio de aprendizaje por refuerzo profundo (DRL por sus siglas en ingles), empleando específicamente el algoritmo de DQN(Deep QLearning)[1], para cinco drones simulados en un ambiente parcialmente observable por medio de sensores ultrasonicos. En este proyecto se implementó una estructura básica de enjambre[2] evaluando la capacidad de aprendizaje de un solo dron en un mapa con obstaculos dinámicos. Es decir, se implementó una estructura vainilla de aprendizaje por refuerzo para un unico agente, la cual se replicó para cinco drones a través de un control centralizado. El ambiente de aprendizaje fue realizado en el simluador Coppeliasim[3], el cual fue conectado por medio de la API (interfaz de programacion de aplicaciones) remota de Python con la librería Stable.Baselines3[4], la cual ofrece una implementacion de código abierto para el algoritmo DQN. Se entrenó dos modelos de agentes, uno para un ambiente con ´ obstaculos estáticos y otro para obstáculos dinámicos, sobre ´ los cuales se les hizo distintas pruebas para llegar a distintos objetivos desde varios puntos iniciales. Se obtuvieron resultados positivos con distintos porcentajes de exitos tanto en la ´ operacion de un solo dron, tanto como para la formación de cinco patrones distintos en el modelo dinamico empleando cinco drones. Demostracion de los resultados puede verse en este enlace https://youtu.be/hzlIE LR3FkThis degree project deals with the problem of autonomous navigation in 3D through deep reinforcement learning (DRL), specifically using the DQN (Deep QLearning) algorithm[1], for five simulated drones in an partially observable environment by means of ultrasonic sensors. In this project, a basic swarm structure[2] was implemented by evaluating the learning capacity of a single drone on a map with dynamic obstacles. That is, a vanilla reinforcement learning structure was implemented for a single agent, which was replicated for five drones through centralized control. The learning environment was carried out in the Coppeliasim[3] simulator, which was connected through the remote Python API (application programming interface) with the Stable-Baselines3[4] library, which offers an open code implementation for the DQN algorithm. Two agent models were trained, one for an environment with static obstacles and another for dynamic obstacles, on which were made different tests to reach different objectives from various initial points. Positive results were obtained with different percentages of success both in the operation of a single drone, as well as for the formation of five different patterns in the dynamic model using five drones. Demonstration of the results can be seen at this link https://youtu.be/hzlIE LR3FkIngeniero ElectrónicoPregrado11 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaFormación de patrones por movimiento autónomo a través de algoritmos de Deep QLearningTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPDeep QlearningNavegación autónomaNavegación sin mapaEvasión de obstáculosAprendizaje por refuerzoIngeniería201815552Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::16201-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::16201-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::16201-1TEXT25803.pdf.txt25803.pdf.txtExtracted texttext/plain53230https://repositorio.uniandes.edu.co/bitstreams/2ca78f80-de5e-4a17-ade2-688316c0a15d/download3aef75a51e50c7be79139d73483abd97MD52ORIGINAL25803.pdfapplication/pdf3609983https://repositorio.uniandes.edu.co/bitstreams/8ccf654d-df92-4217-882f-7b24b6cdb15d/download888bf54e43842cb22688cb0f7cf668c8MD51THUMBNAIL25803.pdf.jpg25803.pdf.jpgIM Thumbnailimage/jpeg31874https://repositorio.uniandes.edu.co/bitstreams/ce1bdaf9-794d-48a0-a347-ae3a55441af6/download1836ec3d675410cebbb8721eedf099e0MD531992/55697oai:repositorio.uniandes.edu.co:1992/556972024-03-13 15:39:51.987https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co