Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico

El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algor...

Full description

Autores:
Perafán Bermúdez, Álvaro Alfonso
Rinaldy Potes, Martha Lucía
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/9644
Acceso en línea:
http://hdl.handle.net/10584/9644
Palabra clave:
Robótica móvil
Inteligencia artificial
Reinforcement learning
Q-learning
Rights
License
Universidad del Norte
Description
Summary:El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algoritmos de Reinforcement Learning o más específicamente, Q-Learning, programados en Python, con el motivo de instruir la importancia de estas en el futuro de las ingenierías y la industria. Adicionalmente, se aplican estos conceptos a un problema físico, en este caso, el movimiento de dos robots a través de una cuadrícula de 6x6. Esta demostración se hace bajo la estructura del videojuego ‘El Gato & El Ratón’, donde, a los mencionados se les conoce como agentes. El juego tiene dos modos de jugador, el Jugador-Jugador (JcJ) y el Jugador-Máquina (JcM). Para el caso del Jugador-Jugador, se crea una interfaz que puede ser controlada manualmente. Esta se enlaza al entorno real por medio de una conexión de bluetooth aplicada para la manipulación de los robots móviles desde el ordenador. En el caso del modo Jugador-Máquina, el ordenador toma el rol de uno de los agentes (En este caso, el agente entrenado es el ratón) gracias al algoritmo de Q-Learning, que le permite también tomar, de manera autónoma, el control de uno de los robots. Este mismo controla físicamente al robot encargado de simular al agente en cuestión. El juego finaliza una vez el agente ratón haya encontrado al queso o el agente gato haya atrapado al agente ratón. Finalmente, según las simulaciones realizadas, se observó el comportamiento a partir de las recompensas y penalizaciones digitadas para cada decisión realizada por el ratón. Estas simulaciones modelan la creación de una personalidad de este agente las cuales se consideraron con las etiquetas miedoso, hambriento y balanceado.