Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo

EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje in...

Full description

Autores:
Gómez Garzón, Nicolás David
Peña Castro, Néstor Harbey
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/46788
Acceso en línea:
http://hdl.handle.net/11634/46788
Palabra clave:
Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANTTOMAS2_76a7b83fa13f10f2b35b96324d731456
oai_identifier_str oai:repository.usta.edu.co:11634/46788
network_acronym_str SANTTOMAS2
network_name_str Repositorio Institucional USTA
repository_id_str
dc.title.spa.fl_str_mv Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
title Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
spellingShingle Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
title_short Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
title_full Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
title_fullStr Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
title_full_unstemmed Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
title_sort Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
dc.creator.fl_str_mv Gómez Garzón, Nicolás David
Peña Castro, Néstor Harbey
dc.contributor.advisor.none.fl_str_mv Calderón Chávez, Juan Manuel
dc.contributor.author.none.fl_str_mv Gómez Garzón, Nicolás David
Peña Castro, Néstor Harbey
dc.contributor.orcid.spa.fl_str_mv https://orcid.org/0000-0002-4471-3980
dc.contributor.cvlac.spa.fl_str_mv https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000380938
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001693663
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001837899
dc.contributor.corporatename.spa.fl_str_mv Universidad Santo Tomás
dc.subject.keyword.spa.fl_str_mv Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
topic Leader-follower
deep reinforcement learning
deep learning
swarm
Deep Q networks
Pybullet
trajectory
simulation
repulsion
Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
dc.subject.lemb.spa.fl_str_mv Ingeniería Electrónica
Algoritmos-Aprendizaje
Software
Métodos de simulación
dc.subject.proposal.spa.fl_str_mv enjambre
drones
aprendizaje por refuerzo profundo
Movimientos Coordinados
Repulsión
Simulación
Pybullet
trayectoria
description EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-08-30T12:49:55Z
dc.date.available.none.fl_str_mv 2022-08-30T12:49:55Z
dc.date.issued.none.fl_str_mv 2022-08-29
dc.type.none.fl_str_mv bachelor thesis
dc.type.local.spa.fl_str_mv Tesis de pregrado
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.spa.fl_str_mv Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/46788
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/46788
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Saith Rodrıguez y col. «Fast path planning algorithm for the robocup small size league». En: Robot Soccer World Cup. Springer. 2014, págs. 407-418.
Saith Rodrıguez y col. «STOx’s 2016 Team description paper». En: (2013).
Saith Rodrıguez y col. «STOx’s 2015 Extended Team Description Paper». En: Joao Pessoa, Brazil (2014)
Jose León y col. «Robot swarms theory applicable to seek and rescue operation». En: International Conference on Intelligent Systems Design and Applications. Springer. 2016, págs. 1061-1070
Juan D Pabon y col. «Event-Triggered Control for Weight-Unbalanced Directed Robot Networks». En: 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. 2021, págs. 5831-5836.
Nestor I Ospina y col. «Argrohbots: An affordable and replicable ground homogeneous robot swarm testbed». En: IFAC-PapersOnLine 54.13 (2021), págs. 256-261.
Edgar C Camacho, Nestor I Ospina y Juan M Calderón. «COVID-Bot: UV-C Based Autonomous Sanitizing Robotic Platform for COVID-19». En: Ifac-papersonline 54.13 (2021), págs. 317-322.
Edgar C Camacho, Jose Guillermo Guarnizo, Juan M Calderon y col. «Design and Construction of a Cost-Oriented Mobile Robot for Domestic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 293-298.
Laura J Padilla Reyes y col. «Adaptable Recommendation System for Outfit Selection with Deep Learning Approach». En: IFAC-PapersOnLine 54.13 (2021), págs. 605-610.
Daniel A Rincón-Riveros y col. «Automation System Based on NLP for Legal Clinic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 283-288.
Bharat Rao, Ashwin Goutham Gopi y Romana Maione. «The societal impact of commercial drones». En: Technology in Society 45 (2016), págs. 83-90.
U S Robotics. «A Roadmap for US Robotics». En: Robotics (2020), págs. 1-90. URL: http: //www.hichristensen.com/pdf/roadmap-2020.pdf.
oshuah K Stolaroff y col. «Energy use and life cycle greenhouse gas emissions of drones for commercial package delivery». En: Nature communications 9.1 (2018), págs. 1-13.
Frank Veroustraete. «The rise of the drones in agriculture». En: EC agriculture 2.2 (2015), págs. 325-327.
Gustavo A. Cardona y Juan M. Calderon. «Robot swarm navigation and victim detection using rendezvous consensus in search and rescue operations». En: Applied Sciences (Switzerland) 9.8 (2019). ISSN: 20763417. DOI: 10.3390/app9081702.
Eliseo Ferrante y col. «“Look out!”: Socially-Mediated Obstacle Avoidance in Collective Transport». En: (sep. de 2010), págs. 572-573. DOI: 10.1007/978-3-642-15461-4_66.
Thanh Thi Nguyen, Ngoc Duy Nguyen y Saeid Nahavandi. «Deep reinforcement learning for multiagent systems: A review of challenges, solutions, and applications». En: IEEE transactions on cybernetics (2020).
Manuele Brambilla y col. «Swarm robotics: A review from the swarm engineering perspective». En: Swarm Intelligence 7.1 (2013), págs. 1-41. ISSN: 19353812. DOI: 10.1007/ s11721-012-0075-2.
Christopher JCH Watkins y Peter Dayan. «Q-learning». En: Machine learning 8.3-4 (1992), págs. 279-292.
Volodymyr Mnih y col. «Human-level control through deep reinforcement learning». En: nature 518.7540 (2015), págs. 529-533.
Edward Lee Thorndike. «Animal intelligence: An experimental study of the associate processes in animals.» En: American Psychologist 53.10 (1998), pág. 1125.
Lucian Busoniu, Robert Babuska y Bart De Schutter. «A comprehensive survey of multiagent reinforcement learning». En: IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) 38.2 (2008), págs. 156-172.
Eric Bonabeau y col. Swarm intelligence: from natural to artificial systems. 1. Oxford university press, 1999
Feng WeiXing y col. «Novel algorithms for coordination of underwater swarm robotics». En: 2006 International Conference on Mechatronics and Automation. IEEE. 2006, págs. 654-659.
Timothy Stirling y Dario Floreano. «Energy Efficient Swarm Deployment for Search in Unknown Environments.» En: (ene. de 2010), págs. 562-563.
Wenguo Liu y Alan FT Winfield. «Modeling and optimization of adaptive foraging in swarm robotic systems». En: The International Journal of Robotics Research 29.14 (2010), págs. 1743-1760.
Eliseo Ferrante y col. «Socially-mediated negotiation for obstacle avoidance in collective transport». En: Distributed autonomous robotic systems. Springer, 2013, págs. 571-583.
Patricio Cruz y Rafael Fierro. «Autonomous lift of a cable-suspended load by an unmanned aerial robot». En: 2014 IEEE conference on control applications (CCA). IEEE. 2014, págs. 802-807.
GA Cardona, D Tellez-Castro y E Mojica-Nava. «Cooperative transportation of a cablesuspended load by multiple quadrotors». En: IFAC-PapersOnLine 52.20 (2019), págs. 145-150.
Miguel F Arevalo-Castiblanco y col. «An adaptive optimal control modification with input uncertainty for unknown heterogeneous agents synchronization». En: 2019 IEEE 58th Conference on Decision and Control (CDC). IEEE. 2019, págs. 8242-8247.
Gustavo A Cardona y col. «Adaptive Multi-Quadrotor Control for Cooperative Transportation of a Cable-Suspended Load». En: 2021 European Control Conference (ECC). IEEE. 2021, págs. 696-701.
Gustavo A Cardona y col. «Robust adaptive synchronization of interconnected heterogeneous quadrotors transporting a cable-suspended load». En: 2021 IEEE International Conference on Robotics and Automation (ICRA). IEEE. 2021, págs. 31-37.
Wilson O Quesada y col. «Leader-Follower formation for UAV robot swarm based on fuzzy logic theory». En: International Conference on Artificial Intelligence and Soft Computing. Springer. 2018, págs. 740-751.
Maximilian Hüttenrauch, Sosic Adrian, Gerhard Neumann y col. «Deep reinforcement learning for swarm systems». En: Journal of Machine Learning Research 20.54 (2019), págs. 1-31.
Xudong Zhu, Fan Zhang y Hui Li. «Swarm Deep Reinforcement Learning for Robotic Manipulation». En: Procedia Computer Science 198 (2022), págs. 472-479.
Sitong Zhang, Yibing Li y Qianhui Dong. «Autonomous navigation of UAV in multiobstacle environments based on a Deep Reinforcement Learning approach». En: Applied Soft Computing 115 (2022), pág. 108194.
E U Robotics AISBL. «Robotics 2020 Multi-Annual Roadmap n for Robotics in Europe, Call 1 ICT23–Horizon 2020». En: Initial Release B 15.01 (2014), pág. 2014.
Henrik I Christensen y col. «A roadmap for us robotics: from internet to robotics». En: Computing Community Consortium 44 (2009).
David Baldazo, Juan Parras y Santiago Zazo. «Decentralized Multi-Agent deep reinforcement learning in swarms of drones for flood monitoring». En: 2019 27th European Signal Processing Conference (EUSIPCO). IEEE. 2019, págs. 1-5.
Adrian Cervera Andes. «Coordinación y control de robots móviles basado en agentes». Tesis doct. Universitat Politècnica de València, 2011.
Pedro José Sanz Valero. Introducción a la robótica inteligente. 2006.
Rebeca Solıs-Ortega. «Enjambres de robots y sus aplicaciones en la exploración y comunicación». En: Memorias de congresos TEC. 2017.
Lukasz Kaiser y col. «Model-based reinforcement learning for atari». En: arXiv preprint arXiv:1903.00374 (2019).
GA Cardona y col. «Autonomous navigation for exploration of unknown environments and collision avoidance in mobile robots using reinforcement learning». En: 2019 SoutheastCon. IEEE. 2019, págs. 1-7
Pablo San José Barrios. «Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis». Tesis doct. ETSI_Informatica, 2019.
Richard S Sutton y Andrew G Barto. Reinforcement learning: An introduction. MIT press, 2018.
Peter Dayan. «Reinforcement learning». En: Stevens’ Handbook of Experimental Psychology (2002).
Alba Centeno Franco. «Deep learning». En: (2019)
Ankit Choudhary. «A hands-on introduction to deep Q-learning using OpenAI gym in Python». En: Retrived from https://www. analyticsvidhya. com/blog/2019/04/introduction-deepq-learningpython (2019).
Rafael Berlanga Llavori. «Apuntes de Simulación Informática (curso 2009-2010)». En: (2010).
Israel Garcıa Garcıa y col. «Estudio sobre vehıculos aéreos no tripulados y sus aplicaciones». En: (2017).
Nicolás Gómez y col. «Leader-follower Behavior in Multi-agent Systems for Search and Rescue Based on PSO Approach». En: SoutheastCon 2022. IEEE. 2022, págs. 413-420.
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Bogotá
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería Electrónica
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería Electrónica
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/46788/4/license_rdf
https://repository.usta.edu.co/bitstream/11634/46788/5/license.txt
https://repository.usta.edu.co/bitstream/11634/46788/1/2022NestorPe%c3%b1aNicolasGomez.pdf
https://repository.usta.edu.co/bitstream/11634/46788/2/Carta%20aprobacion%20facultad.pdf
https://repository.usta.edu.co/bitstream/11634/46788/3/Carta%20Derechos%20de%20Autor.pdf
https://repository.usta.edu.co/bitstream/11634/46788/6/2022NestorPe%c3%b1aNicolasGomez.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/46788/7/Carta%20aprobacion%20facultad.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/46788/8/Carta%20Derechos%20de%20Autor.pdf.jpg
bitstream.checksum.fl_str_mv 217700a34da79ed616c2feb68d4c5e06
aedeaf396fcd827b537c73d23464fc27
ec6fa2a29450506582becb4c4048643e
c1c76fd625060480422190da5f8503e7
2c85336703c8574a6c3cdf75395ba78d
e3e4d1682fd94b5352fc57ac342175a1
2b5e5bb28f5210146c31fec14d1462a9
48eefdc28c87a7ab8315a77e07b05fb3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv noreply@usta.edu.co
_version_ 1782026111919587328
spelling Calderón Chávez, Juan ManuelGómez Garzón, Nicolás DavidPeña Castro, Néstor Harbeyhttps://orcid.org/0000-0002-4471-3980https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000380938https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001693663https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001837899Universidad Santo Tomás2022-08-30T12:49:55Z2022-08-30T12:49:55Z2022-08-29Gómez Garzón, N. D. y Peña Castro, N. H. (2022). Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.http://hdl.handle.net/11634/46788reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado.This degree project proposes a deep learning algorithm based on Q learning that allows a group of agents to represent a swarm movement, specifically leader follower, implementing a repulsion between agents and evasion of fixed obstacles. The learning model includes two methods to reduce the risk of algorithm divergence, the first of which is the inclusion of a memory of experiences for the system and on the other hand the use of a second . The convergence of the Algorithm achieved in less than 6000 episodes was verified with the help of the MATPLOT library to later be implemented in the simulation environment of the Coppelia Sim software. The evaluation of the model implementation system was carried out through 6 experiments, each one of them representing different situations of obstacle avoidance and leader follow-up, demonstrating that the trained model correctly complies with what is expected.Ingeniero ElectronicoPregradoapplication/pdfspaUniversidad Santo TomásPregrado Ingeniería ElectrónicaFacultad de Ingeniería ElectrónicaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundobachelor thesisTesis de pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisLeader-followerdeep reinforcement learningdeep learningswarmDeep Q networksPybullettrajectorysimulationrepulsionIngeniería ElectrónicaAlgoritmos-AprendizajeSoftwareMétodos de simulaciónenjambredronesaprendizaje por refuerzo profundoMovimientos CoordinadosRepulsiónSimulaciónPybullettrayectoriaCRAI-USTA BogotáSaith Rodrıguez y col. «Fast path planning algorithm for the robocup small size league». En: Robot Soccer World Cup. Springer. 2014, págs. 407-418.Saith Rodrıguez y col. «STOx’s 2016 Team description paper». En: (2013).Saith Rodrıguez y col. «STOx’s 2015 Extended Team Description Paper». En: Joao Pessoa, Brazil (2014)Jose León y col. «Robot swarms theory applicable to seek and rescue operation». En: International Conference on Intelligent Systems Design and Applications. Springer. 2016, págs. 1061-1070Juan D Pabon y col. «Event-Triggered Control for Weight-Unbalanced Directed Robot Networks». En: 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. 2021, págs. 5831-5836.Nestor I Ospina y col. «Argrohbots: An affordable and replicable ground homogeneous robot swarm testbed». En: IFAC-PapersOnLine 54.13 (2021), págs. 256-261.Edgar C Camacho, Nestor I Ospina y Juan M Calderón. «COVID-Bot: UV-C Based Autonomous Sanitizing Robotic Platform for COVID-19». En: Ifac-papersonline 54.13 (2021), págs. 317-322.Edgar C Camacho, Jose Guillermo Guarnizo, Juan M Calderon y col. «Design and Construction of a Cost-Oriented Mobile Robot for Domestic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 293-298.Laura J Padilla Reyes y col. «Adaptable Recommendation System for Outfit Selection with Deep Learning Approach». En: IFAC-PapersOnLine 54.13 (2021), págs. 605-610.Daniel A Rincón-Riveros y col. «Automation System Based on NLP for Legal Clinic Assistance». En: IFAC-PapersOnLine 54.13 (2021), págs. 283-288.Bharat Rao, Ashwin Goutham Gopi y Romana Maione. «The societal impact of commercial drones». En: Technology in Society 45 (2016), págs. 83-90.U S Robotics. «A Roadmap for US Robotics». En: Robotics (2020), págs. 1-90. URL: http: //www.hichristensen.com/pdf/roadmap-2020.pdf.oshuah K Stolaroff y col. «Energy use and life cycle greenhouse gas emissions of drones for commercial package delivery». En: Nature communications 9.1 (2018), págs. 1-13.Frank Veroustraete. «The rise of the drones in agriculture». En: EC agriculture 2.2 (2015), págs. 325-327.Gustavo A. Cardona y Juan M. Calderon. «Robot swarm navigation and victim detection using rendezvous consensus in search and rescue operations». En: Applied Sciences (Switzerland) 9.8 (2019). ISSN: 20763417. DOI: 10.3390/app9081702.Eliseo Ferrante y col. «“Look out!”: Socially-Mediated Obstacle Avoidance in Collective Transport». En: (sep. de 2010), págs. 572-573. DOI: 10.1007/978-3-642-15461-4_66.Thanh Thi Nguyen, Ngoc Duy Nguyen y Saeid Nahavandi. «Deep reinforcement learning for multiagent systems: A review of challenges, solutions, and applications». En: IEEE transactions on cybernetics (2020).Manuele Brambilla y col. «Swarm robotics: A review from the swarm engineering perspective». En: Swarm Intelligence 7.1 (2013), págs. 1-41. ISSN: 19353812. DOI: 10.1007/ s11721-012-0075-2.Christopher JCH Watkins y Peter Dayan. «Q-learning». En: Machine learning 8.3-4 (1992), págs. 279-292.Volodymyr Mnih y col. «Human-level control through deep reinforcement learning». En: nature 518.7540 (2015), págs. 529-533.Edward Lee Thorndike. «Animal intelligence: An experimental study of the associate processes in animals.» En: American Psychologist 53.10 (1998), pág. 1125.Lucian Busoniu, Robert Babuska y Bart De Schutter. «A comprehensive survey of multiagent reinforcement learning». En: IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) 38.2 (2008), págs. 156-172.Eric Bonabeau y col. Swarm intelligence: from natural to artificial systems. 1. Oxford university press, 1999Feng WeiXing y col. «Novel algorithms for coordination of underwater swarm robotics». En: 2006 International Conference on Mechatronics and Automation. IEEE. 2006, págs. 654-659.Timothy Stirling y Dario Floreano. «Energy Efficient Swarm Deployment for Search in Unknown Environments.» En: (ene. de 2010), págs. 562-563.Wenguo Liu y Alan FT Winfield. «Modeling and optimization of adaptive foraging in swarm robotic systems». En: The International Journal of Robotics Research 29.14 (2010), págs. 1743-1760.Eliseo Ferrante y col. «Socially-mediated negotiation for obstacle avoidance in collective transport». En: Distributed autonomous robotic systems. Springer, 2013, págs. 571-583.Patricio Cruz y Rafael Fierro. «Autonomous lift of a cable-suspended load by an unmanned aerial robot». En: 2014 IEEE conference on control applications (CCA). IEEE. 2014, págs. 802-807.GA Cardona, D Tellez-Castro y E Mojica-Nava. «Cooperative transportation of a cablesuspended load by multiple quadrotors». En: IFAC-PapersOnLine 52.20 (2019), págs. 145-150.Miguel F Arevalo-Castiblanco y col. «An adaptive optimal control modification with input uncertainty for unknown heterogeneous agents synchronization». En: 2019 IEEE 58th Conference on Decision and Control (CDC). IEEE. 2019, págs. 8242-8247.Gustavo A Cardona y col. «Adaptive Multi-Quadrotor Control for Cooperative Transportation of a Cable-Suspended Load». En: 2021 European Control Conference (ECC). IEEE. 2021, págs. 696-701.Gustavo A Cardona y col. «Robust adaptive synchronization of interconnected heterogeneous quadrotors transporting a cable-suspended load». En: 2021 IEEE International Conference on Robotics and Automation (ICRA). IEEE. 2021, págs. 31-37.Wilson O Quesada y col. «Leader-Follower formation for UAV robot swarm based on fuzzy logic theory». En: International Conference on Artificial Intelligence and Soft Computing. Springer. 2018, págs. 740-751.Maximilian Hüttenrauch, Sosic Adrian, Gerhard Neumann y col. «Deep reinforcement learning for swarm systems». En: Journal of Machine Learning Research 20.54 (2019), págs. 1-31.Xudong Zhu, Fan Zhang y Hui Li. «Swarm Deep Reinforcement Learning for Robotic Manipulation». En: Procedia Computer Science 198 (2022), págs. 472-479.Sitong Zhang, Yibing Li y Qianhui Dong. «Autonomous navigation of UAV in multiobstacle environments based on a Deep Reinforcement Learning approach». En: Applied Soft Computing 115 (2022), pág. 108194.E U Robotics AISBL. «Robotics 2020 Multi-Annual Roadmap n for Robotics in Europe, Call 1 ICT23–Horizon 2020». En: Initial Release B 15.01 (2014), pág. 2014.Henrik I Christensen y col. «A roadmap for us robotics: from internet to robotics». En: Computing Community Consortium 44 (2009).David Baldazo, Juan Parras y Santiago Zazo. «Decentralized Multi-Agent deep reinforcement learning in swarms of drones for flood monitoring». En: 2019 27th European Signal Processing Conference (EUSIPCO). IEEE. 2019, págs. 1-5.Adrian Cervera Andes. «Coordinación y control de robots móviles basado en agentes». Tesis doct. Universitat Politècnica de València, 2011.Pedro José Sanz Valero. Introducción a la robótica inteligente. 2006.Rebeca Solıs-Ortega. «Enjambres de robots y sus aplicaciones en la exploración y comunicación». En: Memorias de congresos TEC. 2017.Lukasz Kaiser y col. «Model-based reinforcement learning for atari». En: arXiv preprint arXiv:1903.00374 (2019).GA Cardona y col. «Autonomous navigation for exploration of unknown environments and collision avoidance in mobile robots using reinforcement learning». En: 2019 SoutheastCon. IEEE. 2019, págs. 1-7Pablo San José Barrios. «Comparación de técnicas de aprendizaje por refuerzo jugando a un videojuego de tenis». Tesis doct. ETSI_Informatica, 2019.Richard S Sutton y Andrew G Barto. Reinforcement learning: An introduction. MIT press, 2018.Peter Dayan. «Reinforcement learning». En: Stevens’ Handbook of Experimental Psychology (2002).Alba Centeno Franco. «Deep learning». En: (2019)Ankit Choudhary. «A hands-on introduction to deep Q-learning using OpenAI gym in Python». En: Retrived from https://www. analyticsvidhya. com/blog/2019/04/introduction-deepq-learningpython (2019).Rafael Berlanga Llavori. «Apuntes de Simulación Informática (curso 2009-2010)». En: (2010).Israel Garcıa Garcıa y col. «Estudio sobre vehıculos aéreos no tripulados y sus aplicaciones». En: (2017).Nicolás Gómez y col. «Leader-follower Behavior in Multi-agent Systems for Search and Rescue Based on PSO Approach». En: SoutheastCon 2022. IEEE. 2022, págs. 413-420.CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/46788/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/46788/5/license.txtaedeaf396fcd827b537c73d23464fc27MD55open accessORIGINAL2022NestorPeñaNicolasGomez.pdf2022NestorPeñaNicolasGomez.pdfTrabajo de Gradoapplication/pdf4292883https://repository.usta.edu.co/bitstream/11634/46788/1/2022NestorPe%c3%b1aNicolasGomez.pdfec6fa2a29450506582becb4c4048643eMD51open accessCarta aprobacion facultad.pdfCarta aprobacion facultad.pdfcarta aprobación facultadapplication/pdf333877https://repository.usta.edu.co/bitstream/11634/46788/2/Carta%20aprobacion%20facultad.pdfc1c76fd625060480422190da5f8503e7MD52metadata only accessCarta Derechos de Autor.pdfCarta Derechos de Autor.pdfCarta Derechos de autorapplication/pdf288125https://repository.usta.edu.co/bitstream/11634/46788/3/Carta%20Derechos%20de%20Autor.pdf2c85336703c8574a6c3cdf75395ba78dMD53metadata only accessTHUMBNAIL2022NestorPeñaNicolasGomez.pdf.jpg2022NestorPeñaNicolasGomez.pdf.jpgIM Thumbnailimage/jpeg7237https://repository.usta.edu.co/bitstream/11634/46788/6/2022NestorPe%c3%b1aNicolasGomez.pdf.jpge3e4d1682fd94b5352fc57ac342175a1MD56open accessCarta aprobacion facultad.pdf.jpgCarta aprobacion facultad.pdf.jpgIM Thumbnailimage/jpeg6972https://repository.usta.edu.co/bitstream/11634/46788/7/Carta%20aprobacion%20facultad.pdf.jpg2b5e5bb28f5210146c31fec14d1462a9MD57open accessCarta Derechos de Autor.pdf.jpgCarta Derechos de Autor.pdf.jpgIM Thumbnailimage/jpeg8650https://repository.usta.edu.co/bitstream/11634/46788/8/Carta%20Derechos%20de%20Autor.pdf.jpg48eefdc28c87a7ab8315a77e07b05fb3MD58open access11634/46788oai:repository.usta.edu.co:11634/467882023-07-19 18:42:16.698open accessRepositorio Universidad Santo Tomásnoreply@usta.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K