Aportes en la Generalización de Habilidades en Aprendizaje por Imitación de Robots

En programación por demostración (PpD) de robots, las variaciones de posición de los objetos relacionados con una tarea, requieren nuevas trayectorias que respondan a estas. Una de las técnicas existentes, es el modelo de mezcla de gaussianas parametrizado en la tarea. Este modelo permite relacionar...

Full description

Autores:
Hoyos Gutiérrez, José Gabriel
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2015
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/58171
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/58171
http://bdigital.unal.edu.co/54797/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Programación por demostración
Máquina de aprendizaje extremo
Recuperación a fallos en robótica
Aprendizaje incremental en robótica
Humanoids
Programming by demonstration
Imitation learning
Robot execution fail recovery
Robot incremental learning
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En programación por demostración (PpD) de robots, las variaciones de posición de los objetos relacionados con una tarea, requieren nuevas trayectorias que respondan a estas. Una de las técnicas existentes, es el modelo de mezcla de gaussianas parametrizado en la tarea. Este modelo permite relacionar los movimientos del robot con metas y poses de objetos, los cuales son los llamados parámetros de la tarea. Un problema que aparece es que se deben generalizar las trayectorias tanto en el espacio cartesiano, como en el de articulación, más específicamente, se requiere tener la cinemática inversa del robot, con el cual se puedan estimar las trayectorias de articulación, a partir de las trayectorias cartesianas. Un segundo problema que se presenta cuando se manejan objetos deformables, es que se pueden presentar fallos de ejecución, lo que requiere de una o varias acciones de recuperación. Un tercer problema es que, aunque las técnicas de generalización responden ante cambios, en ciertas ocasiones es necesario incluir nuevos comportamientos, los cuales pueden ser diferentes a los ya aprendidos. Este trabajo, se centra en tres aportes relacionados con generalización de trayectorias: i) El aprendizaje y aplicación en PpD de la cinemática directa con una red neuronal llamada máquina de aprendizaje extremo y con la cual se estima la cinemática inversa; ii) La recuperación ante fallos de ejecución en tareas empleando múltiples modelos de mezcla de gaussianas parametrizados en la tarea, y iii) El aprendizaje incremental de trayectorias novedosas en modelos de mezcla de gaussianas parametrizados en la tarea. El funcionamiento de las técnicas propuestas fue probado a través de simulaciones y experimentos con robots reales. La máquina de aprendizaje extremo, aunque requiere un buen número de datos para estimar la cinemática directa, presenta un error bajo cuando se compara con el obtenido por transformaciones homogeneas. Para las propuestas de recuperación a fallos y aprendizaje incremental, se evaluó la tarea de colocar una manga a un maniquí con un manipulador robótico. En la técnica de recuperación de fallos se encontró que la técnica propuesta mejora la realización de la tarea en la mayoría de los casos; y en el aprendizaje incremental, el nuevo modelo parametrizado obtenido después del incremento, presenta mejores respuestas que las logradas empleando el modelo existente