Control de navegación de un dron usando aprendizaje por refuerzo

Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda in...

Full description

Autores:
Villamil Paz, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/53431
Acceso en línea:
http://hdl.handle.net/1992/53431
Palabra clave:
Drones
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_0cfc1748b2437181c0f2b298bfc89886
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/53431
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Control de navegación de un dron usando aprendizaje por refuerzo
title Control de navegación de un dron usando aprendizaje por refuerzo
spellingShingle Control de navegación de un dron usando aprendizaje por refuerzo
Drones
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
title_short Control de navegación de un dron usando aprendizaje por refuerzo
title_full Control de navegación de un dron usando aprendizaje por refuerzo
title_fullStr Control de navegación de un dron usando aprendizaje por refuerzo
title_full_unstemmed Control de navegación de un dron usando aprendizaje por refuerzo
title_sort Control de navegación de un dron usando aprendizaje por refuerzo
dc.creator.fl_str_mv Villamil Paz, Santiago
dc.contributor.advisor.none.fl_str_mv Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Villamil Paz, Santiago
dc.contributor.jury.none.fl_str_mv Martínez Piazuelo, Juan Pablo
Higuera Arias, Carolina
dc.subject.armarc.none.fl_str_mv Drones
Aprendizaje por refuerzo (Aprendizaje automático)
topic Drones
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzo
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-11-03T16:22:16Z
dc.date.available.none.fl_str_mv 2021-11-03T16:22:16Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/53431
dc.identifier.pdf.none.fl_str_mv 24390.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/53431
identifier_str_mv 24390.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 10 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/49b3eda0-426a-4819-8941-491ec31e6be4/download
https://repositorio.uniandes.edu.co/bitstreams/f11d28d6-7444-4063-b73b-b9cbc5186da8/download
https://repositorio.uniandes.edu.co/bitstreams/bde6aba3-a81c-484a-b43b-429c5ca86f77/download
bitstream.checksum.fl_str_mv 4b4fea03f0c3a4017164d5baaf42ae95
2fedf5969c92e599ee34786c485f7be1
bced65116be9da3f104b60959021cf5b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812134008777080832
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Lozano Martínez, Fernando Enriquevirtual::13186-1Villamil Paz, Santiago20a16f5c-4f12-4402-aa46-e630ba3ff477500Martínez Piazuelo, Juan PabloHiguera Arias, Carolina2021-11-03T16:22:16Z2021-11-03T16:22:16Z2021http://hdl.handle.net/1992/5343124390.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzoThis degree project will deal with the problem of navigation of a mobile robot and specifically of a drone in simulation using reinforcement learning techniques. To achieve drone navigation through machine learning techniques, we worked with Q-Learning tabular and in second instance, with the DQN technique: Deep Q Network. For this project the simulator was: V-rep (Coppelia-Sim) , the Python as programming language and a library for the implementation of the DQN: stable baselines3. This document will show the process to carry out each the implementations. The results were good in the tabular algorithm and also with the DQN, being this last the best algorithm. The drone on simulation will be able to go from point A to point B dodging obstacles through learned politics. This policy makes that the drone reaches the target obtaining a success rate of 90%, this measurement was performed on 1000. In the following link you can see the results obtained and the aditional tests: https://youtu.be/N7BogcedDzoIngeniero ElectrónicoPregrado10 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaControl de navegación de un dron usando aprendizaje por refuerzoTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPDronesAprendizaje por refuerzo (Aprendizaje automático)Ingeniería201715408Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13186-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13186-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::13186-1TEXT24390.pdf.txt24390.pdf.txtExtracted texttext/plain42139https://repositorio.uniandes.edu.co/bitstreams/49b3eda0-426a-4819-8941-491ec31e6be4/download4b4fea03f0c3a4017164d5baaf42ae95MD54ORIGINAL24390.pdfapplication/pdf5355410https://repositorio.uniandes.edu.co/bitstreams/f11d28d6-7444-4063-b73b-b9cbc5186da8/download2fedf5969c92e599ee34786c485f7be1MD51THUMBNAIL24390.pdf.jpg24390.pdf.jpgIM Thumbnailimage/jpeg30224https://repositorio.uniandes.edu.co/bitstreams/bde6aba3-a81c-484a-b43b-429c5ca86f77/downloadbced65116be9da3f104b60959021cf5bMD551992/53431oai:repositorio.uniandes.edu.co:1992/534312024-03-13 14:52:33.244https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co