Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje in...
- Autores:
-
Gómez Garzón, Nicolás David
Peña Castro, Néstor Harbey
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad Santo Tomás
- Repositorio:
- Repositorio Institucional USTA
- Idioma:
- spa
- OAI Identifier:
- oai:repository.usta.edu.co:11634/46788
- Acceso en línea:
- http://hdl.handle.net/11634/46788
- Palabra clave:
- Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 2.5 Colombia
id |
SANTTOMAS2_76a7b83fa13f10f2b35b96324d731456 |
---|---|
oai_identifier_str |
oai:repository.usta.edu.co:11634/46788 |
network_acronym_str |
SANTTOMAS2 |
network_name_str |
Repositorio Institucional USTA |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
title |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
spellingShingle |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo Leader-follower deep reinforcement learning deep learning swarm Deep Q networks Pybullet trajectory simulation repulsion Ingeniería Electrónica Algoritmos-Aprendizaje Software Métodos de simulación enjambre drones aprendizaje por refuerzo profundo Movimientos Coordinados Repulsión Simulación Pybullet trayectoria |
title_short |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
title_full |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
title_fullStr |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
title_full_unstemmed |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
title_sort |
Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo |
dc.creator.fl_str_mv |
Gómez Garzón, Nicolás David Peña Castro, Néstor Harbey |
dc.contributor.advisor.none.fl_str_mv |
Calderón Chávez, Juan Manuel |
dc.contributor.author.none.fl_str_mv |
Gómez Garzón, Nicolás David Peña Castro, Néstor Harbey |
dc.contributor.orcid.spa.fl_str_mv |
https://orcid.org/0000-0002-4471-3980 |
dc.contributor.cvlac.spa.fl_str_mv |
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000380938 https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001693663 https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001837899 |
dc.contributor.corporatename.spa.fl_str_mv |
Universidad Santo Tomás |
dc.subject.keyword.spa.fl_str_mv |
Leader-follower deep reinforcement learning deep learning swarm Deep Q networks Pybullet trajectory simulation repulsion |
topic |
Leader-follower deep reinforcement learning deep learning swarm Deep Q networks Pybullet trajectory simulation repulsion Ingeniería Electrónica Algoritmos-Aprendizaje Software Métodos de simulación enjambre drones aprendizaje por refuerzo profundo Movimientos Coordinados Repulsión Simulación Pybullet trayectoria |
dc.subject.lemb.spa.fl_str_mv |
Ingeniería Electrónica Algoritmos-Aprendizaje Software Métodos de simulación |
dc.subject.proposal.spa.fl_str_mv |
enjambre drones aprendizaje por refuerzo profundo Movimientos Coordinados Repulsión Simulación Pybullet trayectoria |
description |
EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-08-30T12:49:55Z |
dc.date.available.none.fl_str_mv |
2022-08-30T12:49:55Z |
dc.date.issued.none.fl_str_mv |
2022-08-29 |
dc.type.none.fl_str_mv |
bachelor thesis |
dc.type.local.spa.fl_str_mv |
Tesis de pregrado |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.drive.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.citation.spa.fl_str_mv |
Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional. |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/11634/46788 |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad Santo Tomás |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Santo Tomás |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.usta.edu.co |
identifier_str_mv |
Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional. reponame:Repositorio Institucional Universidad Santo Tomás instname:Universidad Santo Tomás repourl:https://repository.usta.edu.co |
url |
http://hdl.handle.net/11634/46788 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Saith Rodrıguez y col. «Fast path planning algorithm for the robocup small size league». En: Robot Soccer World Cup. Springer. 2014, págs. 407-418. Saith Rodrıguez y col. «STOx’s 2016 Team description paper». En: (2013). Saith Rodrıguez y col. «STOx’s 2015 Extended Team Description Paper». En: Joao Pessoa, Brazil (2014) Jose León y col. «Robot swarms theory applicable to seek and rescue operation». En: International Conference on Intelligent Systems Design and Applications. Springer. 2016, págs. 1061-1070 Juan D Pabon y col. «Event-Triggered Control for Weight-Unbalanced Directed Robot Networks». En: 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. 2021, págs. 5831-5836. Nestor I Ospina y col. «Argrohbots: An affordable and replicable ground homogeneous robot swarm testbed». En: IFAC-PapersOnLine 54.13 (2021), págs. 256-261. Edgar C Camacho, Nestor I Ospina y Juan M Calderón. «COVID-Bot: UV-C Based Autonomous Sanitizing Robotic Platform for COVID-19». En: Ifac-papersonline 54.13 (2021), págs. 317-322. Edgar C Camacho, Jose Guillermo Guarnizo, Juan M Calderon y col. «Design and Construction of a Cost-Oriented Mobile Robot for Domestic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 293-298. Laura J Padilla Reyes y col. «Adaptable Recommendation System for Outfit Selection with Deep Learning Approach». En: IFAC-PapersOnLine 54.13 (2021), págs. 605-610. Daniel A Rincón-Riveros y col. «Automation System Based on NLP for Legal Clinic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 283-288. Bharat Rao, Ashwin Goutham Gopi y Romana Maione. «The societal impact of commercial drones». En: Technology in Society 45 (2016), págs. 83-90. U S Robotics. «A Roadmap for US Robotics». En: Robotics (2020), págs. 1-90. URL: http: //www.hichristensen.com/pdf/roadmap-2020.pdf. oshuah K Stolaroff y col. «Energy use and life cycle greenhouse gas emissions of drones for commercial package delivery». En: Nature communications 9.1 (2018), págs. 1-13. Frank Veroustraete. «The rise of the drones in agriculture». En: EC agriculture 2.2 (2015), págs. 325-327. Gustavo A. Cardona y Juan M. Calderon. «Robot swarm navigation and victim detection using rendezvous consensus in search and rescue operations». En: Applied Sciences (Switzerland) 9.8 (2019). ISSN: 20763417. DOI: 10.3390/app9081702. Eliseo Ferrante y col. «“Look out!”: Socially-Mediated Obstacle Avoidance in Collective Transport». En: (sep. de 2010), págs. 572-573. DOI: 10.1007/978-3-642-15461-4_66. Thanh Thi Nguyen, Ngoc Duy Nguyen y Saeid Nahavandi. «Deep reinforcement learning for multiagent systems: A review of challenges, solutions, and applications». En: IEEE transactions on cybernetics (2020). Manuele Brambilla y col. «Swarm robotics: A review from the swarm engineering perspective». En: Swarm Intelligence 7.1 (2013), págs. 1-41. ISSN: 19353812. DOI: 10.1007/ s11721-012-0075-2. Christopher JCH Watkins y Peter Dayan. «Q-learning». En: Machine learning 8.3-4 (1992), págs. 279-292. Volodymyr Mnih y col. «Human-level control through deep reinforcement learning». En: nature 518.7540 (2015), págs. 529-533. Edward Lee Thorndike. «Animal intelligence: An experimental study of the associate processes in animals.» En: American Psychologist 53.10 (1998), pág. 1125. Lucian Busoniu, Robert Babuska y Bart De Schutter. «A comprehensive survey of multiagent reinforcement learning». En: IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) 38.2 (2008), págs. 156-172. Eric Bonabeau y col. Swarm intelligence: from natural to artificial systems. 1. Oxford university press, 1999 Feng WeiXing y col. «Novel algorithms for coordination of underwater swarm robotics». En: 2006 International Conference on Mechatronics and Automation. IEEE. 2006, págs. 654-659. Timothy Stirling y Dario Floreano. «Energy Efficient Swarm Deployment for Search in Unknown Environments.» En: (ene. de 2010), págs. 562-563. Wenguo Liu y Alan FT Winfield. «Modeling and optimization of adaptive foraging in swarm robotic systems». En: The International Journal of Robotics Research 29.14 (2010), págs. 1743-1760. Eliseo Ferrante y col. «Socially-mediated negotiation for obstacle avoidance in collective transport». En: Distributed autonomous robotic systems. Springer, 2013, págs. 571-583. Patricio Cruz y Rafael Fierro. «Autonomous lift of a cable-suspended load by an unmanned aerial robot». En: 2014 IEEE conference on control applications (CCA). IEEE. 2014, págs. 802-807. GA Cardona, D Tellez-Castro y E Mojica-Nava. «Cooperative transportation of a cablesuspended load by multiple quadrotors». En: IFAC-PapersOnLine 52.20 (2019), págs. 145-150. Miguel F Arevalo-Castiblanco y col. «An adaptive optimal control modification with input uncertainty for unknown heterogeneous agents synchronization». En: 2019 IEEE 58th Conference on Decision and Control (CDC). IEEE. 2019, págs. 8242-8247. Gustavo A Cardona y col. «Adaptive Multi-Quadrotor Control for Cooperative Transportation of a Cable-Suspended Load». En: 2021 European Control Conference (ECC). IEEE. 2021, págs. 696-701. Gustavo A Cardona y col. «Robust adaptive synchronization of interconnected heterogeneous quadrotors transporting a cable-suspended load». En: 2021 IEEE International Conference on Robotics and Automation (ICRA). IEEE. 2021, págs. 31-37. Wilson O Quesada y col. «Leader-Follower formation for UAV robot swarm based on fuzzy logic theory». En: International Conference on Artificial Intelligence and Soft Computing. Springer. 2018, págs. 740-751. Maximilian Hüttenrauch, Sosic Adrian, Gerhard Neumann y col. «Deep reinforcement learning for swarm systems». En: Journal of Machine Learning Research 20.54 (2019), págs. 1-31. Xudong Zhu, Fan Zhang y Hui Li. «Swarm Deep Reinforcement Learning for Robotic Manipulation». En: Procedia Computer Science 198 (2022), págs. 472-479. Sitong Zhang, Yibing Li y Qianhui Dong. «Autonomous navigation of UAV in multiobstacle environments based on a Deep Reinforcement Learning approach». En: Applied Soft Computing 115 (2022), pág. 108194. E U Robotics AISBL. «Robotics 2020 Multi-Annual Roadmap n for Robotics in Europe, Call 1 ICT23–Horizon 2020». En: Initial Release B 15.01 (2014), pág. 2014. Henrik I Christensen y col. «A roadmap for us robotics: from internet to robotics». En: Computing Community Consortium 44 (2009). David Baldazo, Juan Parras y Santiago Zazo. «Decentralized Multi-Agent deep reinforcement learning in swarms of drones for flood monitoring». En: 2019 27th European Signal Processing Conference (EUSIPCO). IEEE. 2019, págs. 1-5. Adrian Cervera Andes. «Coordinación y control de robots móviles basado en agentes». Tesis doct. Universitat Politècnica de València, 2011. Pedro José Sanz Valero. Introducción a la robótica inteligente. 2006. Rebeca Solıs-Ortega. «Enjambres de robots y sus aplicaciones en la exploración y comunicación». En: Memorias de congresos TEC. 2017. Lukasz Kaiser y col. «Model-based reinforcement learning for atari». En: arXiv preprint arXiv:1903.00374 (2019). GA Cardona y col. «Autonomous navigation for exploration of unknown environments and collision avoidance in mobile robots using reinforcement learning». En: 2019 SoutheastCon. IEEE. 2019, págs. 1-7 Pablo San José Barrios. «Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis». Tesis doct. ETSI_Informatica, 2019. Richard S Sutton y Andrew G Barto. Reinforcement learning: An introduction. MIT press, 2018. Peter Dayan. «Reinforcement learning». En: Stevens’ Handbook of Experimental Psychology (2002). Alba Centeno Franco. «Deep learning». En: (2019) Ankit Choudhary. «A hands-on introduction to deep Q-learning using OpenAI gym in Python». En: Retrived from https://www. analyticsvidhya. com/blog/2019/04/introduction-deepq-learningpython (2019). Rafael Berlanga Llavori. «Apuntes de Simulación Informática (curso 2009-2010)». En: (2010). Israel Garcıa Garcıa y col. «Estudio sobre vehıculos aéreos no tripulados y sus aplicaciones». En: (2017). Nicolás Gómez y col. «Leader-follower Behavior in Multi-agent Systems for Search and Rescue Based on PSO Approach». En: SoutheastCon 2022. IEEE. 2022, págs. 413-420. |
dc.rights.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.campus.spa.fl_str_mv |
CRAI-USTA Bogotá |
dc.publisher.spa.fl_str_mv |
Universidad Santo Tomás |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería Electrónica |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería Electrónica |
institution |
Universidad Santo Tomás |
bitstream.url.fl_str_mv |
https://repository.usta.edu.co/bitstream/11634/46788/4/license_rdf https://repository.usta.edu.co/bitstream/11634/46788/5/license.txt https://repository.usta.edu.co/bitstream/11634/46788/1/2022NestorPe%c3%b1aNicolasGomez.pdf https://repository.usta.edu.co/bitstream/11634/46788/2/Carta%20aprobacion%20facultad.pdf https://repository.usta.edu.co/bitstream/11634/46788/3/Carta%20Derechos%20de%20Autor.pdf https://repository.usta.edu.co/bitstream/11634/46788/6/2022NestorPe%c3%b1aNicolasGomez.pdf.jpg https://repository.usta.edu.co/bitstream/11634/46788/7/Carta%20aprobacion%20facultad.pdf.jpg https://repository.usta.edu.co/bitstream/11634/46788/8/Carta%20Derechos%20de%20Autor.pdf.jpg |
bitstream.checksum.fl_str_mv |
217700a34da79ed616c2feb68d4c5e06 aedeaf396fcd827b537c73d23464fc27 ec6fa2a29450506582becb4c4048643e c1c76fd625060480422190da5f8503e7 2c85336703c8574a6c3cdf75395ba78d e3e4d1682fd94b5352fc57ac342175a1 2b5e5bb28f5210146c31fec14d1462a9 48eefdc28c87a7ab8315a77e07b05fb3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Universidad Santo Tomás |
repository.mail.fl_str_mv |
noreply@usta.edu.co |
_version_ |
1782026111919587328 |
spelling |
Calderón Chávez, Juan ManuelGómez Garzón, Nicolás DavidPeña Castro, Néstor Harbeyhttps://orcid.org/0000-0002-4471-3980https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000380938https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001693663https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001837899Universidad Santo Tomás2022-08-30T12:49:55Z2022-08-30T12:49:55Z2022-08-29Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.http://hdl.handle.net/11634/46788reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado.This degree project proposes a deep learning algorithm based on Q learning that allows a group of agents to represent a swarm movement, specifically leader follower, implementing a repulsion between agents and evasion of fixed obstacles. The learning model includes two methods to reduce the risk of algorithm divergence, the first of which is the inclusion of a memory of experiences for the system and on the other hand the use of a second . The convergence of the Algorithm achieved in less than 6000 episodes was verified with the help of the MATPLOT library to later be implemented in the simulation environment of the Coppelia Sim software. The evaluation of the model implementation system was carried out through 6 experiments, each one of them representing different situations of obstacle avoidance and leader follow-up, demonstrating that the trained model correctly complies with what is expected.Ingeniero ElectronicoPregradoapplication/pdfspaUniversidad Santo TomásPregrado Ingeniería ElectrónicaFacultad de Ingeniería ElectrónicaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundobachelor thesisTesis de pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisLeader-followerdeep reinforcement learningdeep learningswarmDeep Q networksPybullettrajectorysimulationrepulsionIngeniería ElectrónicaAlgoritmos-AprendizajeSoftwareMétodos de simulaciónenjambredronesaprendizaje por refuerzo profundoMovimientos CoordinadosRepulsiónSimulaciónPybullettrayectoriaCRAI-USTA BogotáSaith Rodrıguez y col. «Fast path planning algorithm for the robocup small size league». En: Robot Soccer World Cup. Springer. 2014, págs. 407-418.Saith Rodrıguez y col. «STOx’s 2016 Team description paper». En: (2013).Saith Rodrıguez y col. «STOx’s 2015 Extended Team Description Paper». En: Joao Pessoa, Brazil (2014)Jose León y col. «Robot swarms theory applicable to seek and rescue operation». En: International Conference on Intelligent Systems Design and Applications. Springer. 2016, págs. 1061-1070Juan D Pabon y col. «Event-Triggered Control for Weight-Unbalanced Directed Robot Networks». En: 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. 2021, págs. 5831-5836.Nestor I Ospina y col. «Argrohbots: An affordable and replicable ground homogeneous robot swarm testbed». En: IFAC-PapersOnLine 54.13 (2021), págs. 256-261.Edgar C Camacho, Nestor I Ospina y Juan M Calderón. «COVID-Bot: UV-C Based Autonomous Sanitizing Robotic Platform for COVID-19». En: Ifac-papersonline 54.13 (2021), págs. 317-322.Edgar C Camacho, Jose Guillermo Guarnizo, Juan M Calderon y col. «Design and Construction of a Cost-Oriented Mobile Robot for Domestic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 293-298.Laura J Padilla Reyes y col. «Adaptable Recommendation System for Outfit Selection with Deep Learning Approach». En: IFAC-PapersOnLine 54.13 (2021), págs. 605-610.Daniel A Rincón-Riveros y col. «Automation System Based on NLP for Legal Clinic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 283-288.Bharat Rao, Ashwin Goutham Gopi y Romana Maione. «The societal impact of commercial drones». En: Technology in Society 45 (2016), págs. 83-90.U S Robotics. «A Roadmap for US Robotics». En: Robotics (2020), págs. 1-90. URL: http: //www.hichristensen.com/pdf/roadmap-2020.pdf.oshuah K Stolaroff y col. «Energy use and life cycle greenhouse gas emissions of drones for commercial package delivery». En: Nature communications 9.1 (2018), págs. 1-13.Frank Veroustraete. «The rise of the drones in agriculture». En: EC agriculture 2.2 (2015), págs. 325-327.Gustavo A. Cardona y Juan M. Calderon. «Robot swarm navigation and victim detection using rendezvous consensus in search and rescue operations». En: Applied Sciences (Switzerland) 9.8 (2019). ISSN: 20763417. DOI: 10.3390/app9081702.Eliseo Ferrante y col. «“Look out!”: Socially-Mediated Obstacle Avoidance in Collective Transport». En: (sep. de 2010), págs. 572-573. DOI: 10.1007/978-3-642-15461-4_66.Thanh Thi Nguyen, Ngoc Duy Nguyen y Saeid Nahavandi. «Deep reinforcement learning for multiagent systems: A review of challenges, solutions, and applications». En: IEEE transactions on cybernetics (2020).Manuele Brambilla y col. «Swarm robotics: A review from the swarm engineering perspective». En: Swarm Intelligence 7.1 (2013), págs. 1-41. ISSN: 19353812. DOI: 10.1007/ s11721-012-0075-2.Christopher JCH Watkins y Peter Dayan. «Q-learning». En: Machine learning 8.3-4 (1992), págs. 279-292.Volodymyr Mnih y col. «Human-level control through deep reinforcement learning». En: nature 518.7540 (2015), págs. 529-533.Edward Lee Thorndike. «Animal intelligence: An experimental study of the associate processes in animals.» En: American Psychologist 53.10 (1998), pág. 1125.Lucian Busoniu, Robert Babuska y Bart De Schutter. «A comprehensive survey of multiagent reinforcement learning». En: IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) 38.2 (2008), págs. 156-172.Eric Bonabeau y col. Swarm intelligence: from natural to artificial systems. 1. Oxford university press, 1999Feng WeiXing y col. «Novel algorithms for coordination of underwater swarm robotics». En: 2006 International Conference on Mechatronics and Automation. IEEE. 2006, págs. 654-659.Timothy Stirling y Dario Floreano. «Energy Efficient Swarm Deployment for Search in Unknown Environments.» En: (ene. de 2010), págs. 562-563.Wenguo Liu y Alan FT Winfield. «Modeling and optimization of adaptive foraging in swarm robotic systems». En: The International Journal of Robotics Research 29.14 (2010), págs. 1743-1760.Eliseo Ferrante y col. «Socially-mediated negotiation for obstacle avoidance in collective transport». En: Distributed autonomous robotic systems. Springer, 2013, págs. 571-583.Patricio Cruz y Rafael Fierro. «Autonomous lift of a cable-suspended load by an unmanned aerial robot». En: 2014 IEEE conference on control applications (CCA). IEEE. 2014, págs. 802-807.GA Cardona, D Tellez-Castro y E Mojica-Nava. «Cooperative transportation of a cablesuspended load by multiple quadrotors». En: IFAC-PapersOnLine 52.20 (2019), págs. 145-150.Miguel F Arevalo-Castiblanco y col. «An adaptive optimal control modification with input uncertainty for unknown heterogeneous agents synchronization». En: 2019 IEEE 58th Conference on Decision and Control (CDC). IEEE. 2019, págs. 8242-8247.Gustavo A Cardona y col. «Adaptive Multi-Quadrotor Control for Cooperative Transportation of a Cable-Suspended Load». En: 2021 European Control Conference (ECC). IEEE. 2021, págs. 696-701.Gustavo A Cardona y col. «Robust adaptive synchronization of interconnected heterogeneous quadrotors transporting a cable-suspended load». En: 2021 IEEE International Conference on Robotics and Automation (ICRA). IEEE. 2021, págs. 31-37.Wilson O Quesada y col. «Leader-Follower formation for UAV robot swarm based on fuzzy logic theory». En: International Conference on Artificial Intelligence and Soft Computing. Springer. 2018, págs. 740-751.Maximilian Hüttenrauch, Sosic Adrian, Gerhard Neumann y col. «Deep reinforcement learning for swarm systems». En: Journal of Machine Learning Research 20.54 (2019), págs. 1-31.Xudong Zhu, Fan Zhang y Hui Li. «Swarm Deep Reinforcement Learning for Robotic Manipulation». En: Procedia Computer Science 198 (2022), págs. 472-479.Sitong Zhang, Yibing Li y Qianhui Dong. «Autonomous navigation of UAV in multiobstacle environments based on a Deep Reinforcement Learning approach». En: Applied Soft Computing 115 (2022), pág. 108194.E U Robotics AISBL. «Robotics 2020 Multi-Annual Roadmap n for Robotics in Europe, Call 1 ICT23–Horizon 2020». En: Initial Release B 15.01 (2014), pág. 2014.Henrik I Christensen y col. «A roadmap for us robotics: from internet to robotics». En: Computing Community Consortium 44 (2009).David Baldazo, Juan Parras y Santiago Zazo. «Decentralized Multi-Agent deep reinforcement learning in swarms of drones for flood monitoring». En: 2019 27th European Signal Processing Conference (EUSIPCO). IEEE. 2019, págs. 1-5.Adrian Cervera Andes. «Coordinación y control de robots móviles basado en agentes». Tesis doct. Universitat Politècnica de València, 2011.Pedro José Sanz Valero. Introducción a la robótica inteligente. 2006.Rebeca Solıs-Ortega. «Enjambres de robots y sus aplicaciones en la exploración y comunicación». En: Memorias de congresos TEC. 2017.Lukasz Kaiser y col. «Model-based reinforcement learning for atari». En: arXiv preprint arXiv:1903.00374 (2019).GA Cardona y col. «Autonomous navigation for exploration of unknown environments and collision avoidance in mobile robots using reinforcement learning». En: 2019 SoutheastCon. IEEE. 2019, págs. 1-7Pablo San José Barrios. «Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis». Tesis doct. ETSI_Informatica, 2019.Richard S Sutton y Andrew G Barto. Reinforcement learning: An introduction. MIT press, 2018.Peter Dayan. «Reinforcement learning». En: Stevens’ Handbook of Experimental Psychology (2002).Alba Centeno Franco. «Deep learning». En: (2019)Ankit Choudhary. «A hands-on introduction to deep Q-learning using OpenAI gym in Python». En: Retrived from https://www. analyticsvidhya. com/blog/2019/04/introduction-deepq-learningpython (2019).Rafael Berlanga Llavori. «Apuntes de Simulación Informática (curso 2009-2010)». En: (2010).Israel Garcıa Garcıa y col. «Estudio sobre vehıculos aéreos no tripulados y sus aplicaciones». En: (2017).Nicolás Gómez y col. «Leader-follower Behavior in Multi-agent Systems for Search and Rescue Based on PSO Approach». En: SoutheastCon 2022. IEEE. 2022, págs. 413-420.CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/46788/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/46788/5/license.txtaedeaf396fcd827b537c73d23464fc27MD55open accessORIGINAL2022NestorPeñaNicolasGomez.pdf2022NestorPeñaNicolasGomez.pdfTrabajo de Gradoapplication/pdf4292883https://repository.usta.edu.co/bitstream/11634/46788/1/2022NestorPe%c3%b1aNicolasGomez.pdfec6fa2a29450506582becb4c4048643eMD51open accessCarta aprobacion facultad.pdfCarta aprobacion facultad.pdfcarta aprobación facultadapplication/pdf333877https://repository.usta.edu.co/bitstream/11634/46788/2/Carta%20aprobacion%20facultad.pdfc1c76fd625060480422190da5f8503e7MD52metadata only accessCarta Derechos de Autor.pdfCarta Derechos de Autor.pdfCarta Derechos de autorapplication/pdf288125https://repository.usta.edu.co/bitstream/11634/46788/3/Carta%20Derechos%20de%20Autor.pdf2c85336703c8574a6c3cdf75395ba78dMD53metadata only accessTHUMBNAIL2022NestorPeñaNicolasGomez.pdf.jpg2022NestorPeñaNicolasGomez.pdf.jpgIM Thumbnailimage/jpeg7237https://repository.usta.edu.co/bitstream/11634/46788/6/2022NestorPe%c3%b1aNicolasGomez.pdf.jpge3e4d1682fd94b5352fc57ac342175a1MD56open accessCarta aprobacion facultad.pdf.jpgCarta aprobacion facultad.pdf.jpgIM Thumbnailimage/jpeg6972https://repository.usta.edu.co/bitstream/11634/46788/7/Carta%20aprobacion%20facultad.pdf.jpg2b5e5bb28f5210146c31fec14d1462a9MD57open accessCarta Derechos de Autor.pdf.jpgCarta Derechos de Autor.pdf.jpgIM Thumbnailimage/jpeg8650https://repository.usta.edu.co/bitstream/11634/46788/8/Carta%20Derechos%20de%20Autor.pdf.jpg48eefdc28c87a7ab8315a77e07b05fb3MD58open access11634/46788oai:repository.usta.edu.co:11634/467882023-07-19 18:42:16.698open accessRepositorio Universidad Santo Tomásnoreply@usta.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K |