Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico

El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algor...

Full description

Autores:
Perafán Bermúdez, Álvaro Alfonso
Rinaldy Potes, Martha Lucía
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/9644
Acceso en línea:
http://hdl.handle.net/10584/9644
Palabra clave:
Robótica móvil
Inteligencia artificial
Reinforcement learning
Q-learning
Rights
License
Universidad del Norte
id REPOUNORT2_a430f4b05f1123a06030cc8c19ca7862
oai_identifier_str oai:manglar.uninorte.edu.co:10584/9644
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
title Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
spellingShingle Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
Robótica móvil
Inteligencia artificial
Reinforcement learning
Q-learning
title_short Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
title_full Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
title_fullStr Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
title_full_unstemmed Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
title_sort Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
dc.creator.fl_str_mv Perafán Bermúdez, Álvaro Alfonso
Rinaldy Potes, Martha Lucía
dc.contributor.advisor.none.fl_str_mv Caballero, Liesle
Percybrooks, Winston
dc.contributor.author.none.fl_str_mv Perafán Bermúdez, Álvaro Alfonso
Rinaldy Potes, Martha Lucía
dc.subject.es_ES.fl_str_mv Robótica móvil
Inteligencia artificial
topic Robótica móvil
Inteligencia artificial
Reinforcement learning
Q-learning
dc.subject.en_US.fl_str_mv Reinforcement learning
Q-learning
description El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algoritmos de Reinforcement Learning o más específicamente, Q-Learning, programados en Python, con el motivo de instruir la importancia de estas en el futuro de las ingenierías y la industria. Adicionalmente, se aplican estos conceptos a un problema físico, en este caso, el movimiento de dos robots a través de una cuadrícula de 6x6. Esta demostración se hace bajo la estructura del videojuego ‘El Gato & El Ratón’, donde, a los mencionados se les conoce como agentes. El juego tiene dos modos de jugador, el Jugador-Jugador (JcJ) y el Jugador-Máquina (JcM). Para el caso del Jugador-Jugador, se crea una interfaz que puede ser controlada manualmente. Esta se enlaza al entorno real por medio de una conexión de bluetooth aplicada para la manipulación de los robots móviles desde el ordenador. En el caso del modo Jugador-Máquina, el ordenador toma el rol de uno de los agentes (En este caso, el agente entrenado es el ratón) gracias al algoritmo de Q-Learning, que le permite también tomar, de manera autónoma, el control de uno de los robots. Este mismo controla físicamente al robot encargado de simular al agente en cuestión. El juego finaliza una vez el agente ratón haya encontrado al queso o el agente gato haya atrapado al agente ratón. Finalmente, según las simulaciones realizadas, se observó el comportamiento a partir de las recompensas y penalizaciones digitadas para cada decisión realizada por el ratón. Estas simulaciones modelan la creación de una personalidad de este agente las cuales se consideraron con las etiquetas miedoso, hambriento y balanceado.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-06-21T14:22:15Z
dc.date.available.none.fl_str_mv 2021-06-21T14:22:15Z
dc.date.issued.none.fl_str_mv 2021-05-31
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/9644
url http://hdl.handle.net/10584/9644
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Universidad del Norte, 2021
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/9644/1/Dise%c3%b1o%20sin%20t%c3%adtulo%20%281%29.png
https://manglar.uninorte.edu.co/bitstream/10584/9644/2/Dise%c3%b1o%20sin%20t%c3%adtulo.pdf
https://manglar.uninorte.edu.co/bitstream/10584/9644/3/license.txt
bitstream.checksum.fl_str_mv ad6862cbc33cb0515f05d44afcddad30
67a68fa67edff8fa4e3325b03fd513a2
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1812183131167391744
spelling Caballero, LieslePercybrooks, WinstonPerafán Bermúdez, Álvaro AlfonsoRinaldy Potes, Martha Lucía2021-06-21T14:22:15Z2021-06-21T14:22:15Z2021-05-31http://hdl.handle.net/10584/9644El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algoritmos de Reinforcement Learning o más específicamente, Q-Learning, programados en Python, con el motivo de instruir la importancia de estas en el futuro de las ingenierías y la industria. Adicionalmente, se aplican estos conceptos a un problema físico, en este caso, el movimiento de dos robots a través de una cuadrícula de 6x6. Esta demostración se hace bajo la estructura del videojuego ‘El Gato & El Ratón’, donde, a los mencionados se les conoce como agentes. El juego tiene dos modos de jugador, el Jugador-Jugador (JcJ) y el Jugador-Máquina (JcM). Para el caso del Jugador-Jugador, se crea una interfaz que puede ser controlada manualmente. Esta se enlaza al entorno real por medio de una conexión de bluetooth aplicada para la manipulación de los robots móviles desde el ordenador. En el caso del modo Jugador-Máquina, el ordenador toma el rol de uno de los agentes (En este caso, el agente entrenado es el ratón) gracias al algoritmo de Q-Learning, que le permite también tomar, de manera autónoma, el control de uno de los robots. Este mismo controla físicamente al robot encargado de simular al agente en cuestión. El juego finaliza una vez el agente ratón haya encontrado al queso o el agente gato haya atrapado al agente ratón. Finalmente, según las simulaciones realizadas, se observó el comportamiento a partir de las recompensas y penalizaciones digitadas para cada decisión realizada por el ratón. Estas simulaciones modelan la creación de una personalidad de este agente las cuales se consideraron con las etiquetas miedoso, hambriento y balanceado.The following project seeks to demonstrate, in a didactic way, the development of an Artificial Intelligence system based on a reinforcement learning algorithm illustrated in a capture and escape game. The purpose of this project is to cover the operation of tools such as Reinforcement Learning algorithms or more specifically, Q-Learning, programmed in Python, in order to teach the importance of these in the future of engineering and industry. Additionally, these concepts are applied to a physical problem, in this case, the movement of two robots through a 6x6 grid. This demonstration is done under the structure of the video game 'The Cat & The Mouse', where the mentioned are known as agents. The game has two player modes, Player-Player (JcJ) and Player-Machine (JcM). In the case of the Player-Player mode, an interface is created that can be controlled manually. This is linked to the real environment by means of a bluetooth connection applied for the manipulation of the mobile robots from the computer. In the case of the Player-Machine mode, the computer takes the role of one of the agents (in this case, the trained agent is the mouse) thanks to the Q-Learning algorithm, which also allows it to autonomously take control of one of the robots. It physically controls the robot in charge of simulating the agent in question. The game ends once the mouse agent has found the cheese or the cat agent has caught the mouse agent. Finally, according to the simulations performed, the behavior was observed from the rewards and penalties typed for each decision made by the mouse. These simulations model the creation of a personality of this agent, which were considered with the labels shyl, hungry and balanced.spaUniversidad del Norte, 2021Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Robótica móvilInteligencia artificialReinforcement learningQ-learningSistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdicoarticlehttp://purl.org/coar/resource_type/c_6501ORIGINALDiseño sin título (1).pngDiseño sin título (1).pngInterfaz gráfica y entorno física del videojuegoimage/png182365https://manglar.uninorte.edu.co/bitstream/10584/9644/1/Dise%c3%b1o%20sin%20t%c3%adtulo%20%281%29.pngad6862cbc33cb0515f05d44afcddad30MD51Diseño sin título.pdfDiseño sin título.pdfapplication/pdf221497https://manglar.uninorte.edu.co/bitstream/10584/9644/2/Dise%c3%b1o%20sin%20t%c3%adtulo.pdf67a68fa67edff8fa4e3325b03fd513a2MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/9644/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/9644oai:manglar.uninorte.edu.co:10584/96442021-06-21 09:22:15.795Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=