Aprendizaje de movimientos en robot humanoide a partir de inferencia de objetivos

Este documento presenta la aplicación del aprendizaje por refuerzo inverso (IRL por sus siglas en inglés) en un robot humanoide conocido como Poppy Torso, con el fin de realizar movimientos de las extremidades superiores. El aprendizaje por refuerzo inverso se basa en el aprendizaje a partir de las...

Full description

Autores:
Suarez Huertas, Yeison Estiven
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/30072
Acceso en línea:
http://hdl.handle.net/11634/30072
Palabra clave:
Reinforcement learning
Inverse reinforcement learning
Computational neural networks
Machine Learning
Python
Poppy torso
Inference objectives
humanoid robot
Redes neuronales computacionales
Aprendizaje de máquina
Inferencia de objetivos
Humanoides
Aprendizaje por refuerzo
Aprendizaje por refuerzo inverso
Python
Poppy Torso
Inferencia de objetivos
Robot Humanoide
Rights
openAccess
License
Atribución-NoComercial 2.5 Colombia
Description
Summary:Este documento presenta la aplicación del aprendizaje por refuerzo inverso (IRL por sus siglas en inglés) en un robot humanoide conocido como Poppy Torso, con el fin de realizar movimientos de las extremidades superiores. El aprendizaje por refuerzo inverso se basa en el aprendizaje a partir de las demostraciones (trayectorias) de un experto. Con el fin de obtener una utilidad final lo más cercana a la utilidad obtenida por el experto en su recorrido, previamente se implementa un aprendizaje por refuerzo (RL por sus siglas en inglés) con una recompensa plenamente establecida dentro del entorno diseñado, el cual logró cumplir el objetivo que corresponde a generar movimientos desde un punto aleatorio hasta un punto establecido. El robot en simulación logra en la mayoría de los casos (con un porcentaje del 97.5% realizado sobre 1000 pruebas) llegar a su objetivo, tanto por aprendizaje por refuerzo como por refuerzo inverso.