Aprendizaje de movimientos en robot humanoide a partir de inferencia de objetivos
Este documento presenta la aplicación del aprendizaje por refuerzo inverso (IRL por sus siglas en inglés) en un robot humanoide conocido como Poppy Torso, con el fin de realizar movimientos de las extremidades superiores. El aprendizaje por refuerzo inverso se basa en el aprendizaje a partir de las...
- Autores:
-
Suarez Huertas, Yeison Estiven
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2020
- Institución:
- Universidad Santo Tomás
- Repositorio:
- Repositorio Institucional USTA
- Idioma:
- spa
- OAI Identifier:
- oai:repository.usta.edu.co:11634/30072
- Acceso en línea:
- http://hdl.handle.net/11634/30072
- Palabra clave:
- Reinforcement learning
Inverse reinforcement learning
Computational neural networks
Machine Learning
Python
Poppy torso
Inference objectives
humanoid robot
Redes neuronales computacionales
Aprendizaje de máquina
Inferencia de objetivos
Humanoides
Aprendizaje por refuerzo
Aprendizaje por refuerzo inverso
Python
Poppy Torso
Inferencia de objetivos
Robot Humanoide
- Rights
- openAccess
- License
- Atribución-NoComercial 2.5 Colombia
Summary: | Este documento presenta la aplicación del aprendizaje por refuerzo inverso (IRL por sus siglas en inglés) en un robot humanoide conocido como Poppy Torso, con el fin de realizar movimientos de las extremidades superiores. El aprendizaje por refuerzo inverso se basa en el aprendizaje a partir de las demostraciones (trayectorias) de un experto. Con el fin de obtener una utilidad final lo más cercana a la utilidad obtenida por el experto en su recorrido, previamente se implementa un aprendizaje por refuerzo (RL por sus siglas en inglés) con una recompensa plenamente establecida dentro del entorno diseñado, el cual logró cumplir el objetivo que corresponde a generar movimientos desde un punto aleatorio hasta un punto establecido. El robot en simulación logra en la mayoría de los casos (con un porcentaje del 97.5% realizado sobre 1000 pruebas) llegar a su objetivo, tanto por aprendizaje por refuerzo como por refuerzo inverso. |
---|