Control de navegación de un dron usando aprendizaje por refuerzo
Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda in...
- Autores:
-
Villamil Paz, Santiago
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/53431
- Acceso en línea:
- http://hdl.handle.net/1992/53431
- Palabra clave:
- Drones
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id |
UNIANDES2_0cfc1748b2437181c0f2b298bfc89886 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/53431 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Control de navegación de un dron usando aprendizaje por refuerzo |
title |
Control de navegación de un dron usando aprendizaje por refuerzo |
spellingShingle |
Control de navegación de un dron usando aprendizaje por refuerzo Drones Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería |
title_short |
Control de navegación de un dron usando aprendizaje por refuerzo |
title_full |
Control de navegación de un dron usando aprendizaje por refuerzo |
title_fullStr |
Control de navegación de un dron usando aprendizaje por refuerzo |
title_full_unstemmed |
Control de navegación de un dron usando aprendizaje por refuerzo |
title_sort |
Control de navegación de un dron usando aprendizaje por refuerzo |
dc.creator.fl_str_mv |
Villamil Paz, Santiago |
dc.contributor.advisor.none.fl_str_mv |
Lozano Martínez, Fernando Enrique |
dc.contributor.author.none.fl_str_mv |
Villamil Paz, Santiago |
dc.contributor.jury.none.fl_str_mv |
Martínez Piazuelo, Juan Pablo Higuera Arias, Carolina |
dc.subject.armarc.none.fl_str_mv |
Drones Aprendizaje por refuerzo (Aprendizaje automático) |
topic |
Drones Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzo |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-11-03T16:22:16Z |
dc.date.available.none.fl_str_mv |
2021-11-03T16:22:16Z |
dc.date.issued.none.fl_str_mv |
2021 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/53431 |
dc.identifier.pdf.none.fl_str_mv |
24390.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/53431 |
identifier_str_mv |
24390.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
10 páginas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Ingeniería Electrónica |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería Eléctrica y Electrónica |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/49b3eda0-426a-4819-8941-491ec31e6be4/download https://repositorio.uniandes.edu.co/bitstreams/f11d28d6-7444-4063-b73b-b9cbc5186da8/download https://repositorio.uniandes.edu.co/bitstreams/bde6aba3-a81c-484a-b43b-429c5ca86f77/download |
bitstream.checksum.fl_str_mv |
4b4fea03f0c3a4017164d5baaf42ae95 2fedf5969c92e599ee34786c485f7be1 bced65116be9da3f104b60959021cf5b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812134008777080832 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Lozano Martínez, Fernando Enriquevirtual::13186-1Villamil Paz, Santiago20a16f5c-4f12-4402-aa46-e630ba3ff477500Martínez Piazuelo, Juan PabloHiguera Arias, Carolina2021-11-03T16:22:16Z2021-11-03T16:22:16Z2021http://hdl.handle.net/1992/5343124390.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzoThis degree project will deal with the problem of navigation of a mobile robot and specifically of a drone in simulation using reinforcement learning techniques. To achieve drone navigation through machine learning techniques, we worked with Q-Learning tabular and in second instance, with the DQN technique: Deep Q Network. For this project the simulator was: V-rep (Coppelia-Sim) , the Python as programming language and a library for the implementation of the DQN: stable baselines3. This document will show the process to carry out each the implementations. The results were good in the tabular algorithm and also with the DQN, being this last the best algorithm. The drone on simulation will be able to go from point A to point B dodging obstacles through learned politics. This policy makes that the drone reaches the target obtaining a success rate of 90%, this measurement was performed on 1000. In the following link you can see the results obtained and the aditional tests: https://youtu.be/N7BogcedDzoIngeniero ElectrónicoPregrado10 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaControl de navegación de un dron usando aprendizaje por refuerzoTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPDronesAprendizaje por refuerzo (Aprendizaje automático)Ingeniería201715408Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13186-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13186-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::13186-1TEXT24390.pdf.txt24390.pdf.txtExtracted texttext/plain42139https://repositorio.uniandes.edu.co/bitstreams/49b3eda0-426a-4819-8941-491ec31e6be4/download4b4fea03f0c3a4017164d5baaf42ae95MD54ORIGINAL24390.pdfapplication/pdf5355410https://repositorio.uniandes.edu.co/bitstreams/f11d28d6-7444-4063-b73b-b9cbc5186da8/download2fedf5969c92e599ee34786c485f7be1MD51THUMBNAIL24390.pdf.jpg24390.pdf.jpgIM Thumbnailimage/jpeg30224https://repositorio.uniandes.edu.co/bitstreams/bde6aba3-a81c-484a-b43b-429c5ca86f77/downloadbced65116be9da3f104b60959021cf5bMD551992/53431oai:repositorio.uniandes.edu.co:1992/534312024-03-13 14:52:33.244https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |