Learning for safety
Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the...
- Autores:
-
Montenegro González, Carlos Andrés
- Tipo de recurso:
- Fecha de publicación:
- 2021
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/50930
- Acceso en línea:
- http://hdl.handle.net/1992/50930
- Palabra clave:
- Algoritmos (Computadores)
Aprendizaje por refuerzo (Aprendizaje automático)
Sistemas de control por retroalimentación
Funciones de Liapunov
Robótica
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id |
UNIANDES2_7f3139736595e839ddb3746c65b821d5 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/50930 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Learning for safety |
title |
Learning for safety |
spellingShingle |
Learning for safety Algoritmos (Computadores) Aprendizaje por refuerzo (Aprendizaje automático) Sistemas de control por retroalimentación Funciones de Liapunov Robótica Ingeniería |
title_short |
Learning for safety |
title_full |
Learning for safety |
title_fullStr |
Learning for safety |
title_full_unstemmed |
Learning for safety |
title_sort |
Learning for safety |
dc.creator.fl_str_mv |
Montenegro González, Carlos Andrés |
dc.contributor.advisor.none.fl_str_mv |
Rodríguez Herrera, Carlos Francisco Jiménez Leudo, Santiago |
dc.contributor.author.none.fl_str_mv |
Montenegro González, Carlos Andrés |
dc.contributor.jury.none.fl_str_mv |
Saoud, Adnane |
dc.subject.armarc.es_CO.fl_str_mv |
Algoritmos (Computadores) Aprendizaje por refuerzo (Aprendizaje automático) Sistemas de control por retroalimentación Funciones de Liapunov Robótica |
topic |
Algoritmos (Computadores) Aprendizaje por refuerzo (Aprendizaje automático) Sistemas de control por retroalimentación Funciones de Liapunov Robótica Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the performance. Reinforcement Learning (RL) algorithms, on the other hand, have found success in controlling systems with no model at all but it is limited beyond simulated applications, and one main reason is the absence of safety and stability guarantees during the learning process. To address this issue, we complement a controller architecture that combines a model-free RL-based controller with model-based controllers utilizing control-Lyapunov and control-Barrier functions (CLFs and CBFs, respectively) and online learning of the unknown system dynamics, to guarantee stability and safety during learning. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-08-10T18:04:17Z |
dc.date.available.none.fl_str_mv |
2021-08-10T18:04:17Z |
dc.date.issued.none.fl_str_mv |
2021 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/50930 |
dc.identifier.pdf.none.fl_str_mv |
23721.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/50930 |
identifier_str_mv |
23721.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
22 hojas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Maestría en Ingeniería Mecánica |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería Mecánica |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/cb37b342-bfb4-41ad-a61e-df1d86d22762/download https://repositorio.uniandes.edu.co/bitstreams/46f66ce4-2845-4037-9fbb-5063c037abdd/download https://repositorio.uniandes.edu.co/bitstreams/1741d927-aea3-468e-8f00-95bb9ac65c73/download |
bitstream.checksum.fl_str_mv |
ad729cc0c6865be2fe018d3cf8e30a9c 90ea4f096631284fddeadf7019f920dd da08dc48f274b477fc692a6f1b63f3a6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133824875724800 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Rodríguez Herrera, Carlos Franciscovirtual::2036-1Jiménez Leudo, Santiagovirtual::2037-1Montenegro González, Carlos Andrés9ef5ad50-09fc-4f3c-80c3-4b8742261846400Saoud, Adnane2021-08-10T18:04:17Z2021-08-10T18:04:17Z2021http://hdl.handle.net/1992/5093023721.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the performance. Reinforcement Learning (RL) algorithms, on the other hand, have found success in controlling systems with no model at all but it is limited beyond simulated applications, and one main reason is the absence of safety and stability guarantees during the learning process. To address this issue, we complement a controller architecture that combines a model-free RL-based controller with model-based controllers utilizing control-Lyapunov and control-Barrier functions (CLFs and CBFs, respectively) and online learning of the unknown system dynamics, to guarantee stability and safety during learning.La teoría de control no lineal moderna busca dotar a los sistemas de propiedades de estabilidad y seguridad, y se ha desplegado con éxito en múltiples dominios. A pesar de este éxito, la incertidumbre del modelo sigue siendo un reto importante a la hora de sintetizar controladores seguros y estables, lo que provoca una degradación del rendimiento. Los algoritmos de aprendizaje por refuerzo (RL), por otro lado, han tenido éxito en el control de sistemas sin modelo alguno, pero está limitado más allá de las aplicaciones simuladas, y una razón principal es la ausencia de garantías de seguridad y estabilidad durante el proceso de aprendizaje. Para abordar este problema, complementamos una arquitectura de controladores que combina un controlador basado en RL sin modelo con controladores basados en modelos que utilizan funciones de control de Lyapunov y de Barrera (CLFs y CBFs, respectivamente) y el aprendizaje en línea de la dinámica del sistema desconocido, para garantizar la estabilidad y la seguridad durante el aprendizaje.Magíster en Ingeniería MecánicaMaestría22 hojasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería MecánicaFacultad de IngenieríaDepartamento de Ingeniería MecánicaLearning for safetyTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMAlgoritmos (Computadores)Aprendizaje por refuerzo (Aprendizaje automático)Sistemas de control por retroalimentaciónFunciones de LiapunovRobóticaIngeniería201520272Publicationhttps://scholar.google.es/citations?user=O8Cl-rUAAAAJvirtual::2036-10000-0002-7438-8963virtual::2036-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000054020virtual::2036-1e6d7de00-33cf-432f-9b5d-cdcff3b1f6a1virtual::2036-17e80f787-d67a-418f-8b0e-13a177b85c81virtual::2037-1e6d7de00-33cf-432f-9b5d-cdcff3b1f6a1virtual::2036-17e80f787-d67a-418f-8b0e-13a177b85c81virtual::2037-1TEXT23721.pdf.txt23721.pdf.txtExtracted texttext/plain47179https://repositorio.uniandes.edu.co/bitstreams/cb37b342-bfb4-41ad-a61e-df1d86d22762/downloadad729cc0c6865be2fe018d3cf8e30a9cMD54ORIGINAL23721.pdfapplication/pdf663238https://repositorio.uniandes.edu.co/bitstreams/46f66ce4-2845-4037-9fbb-5063c037abdd/download90ea4f096631284fddeadf7019f920ddMD51THUMBNAIL23721.pdf.jpg23721.pdf.jpgIM Thumbnailimage/jpeg16342https://repositorio.uniandes.edu.co/bitstreams/1741d927-aea3-468e-8f00-95bb9ac65c73/downloadda08dc48f274b477fc692a6f1b63f3a6MD551992/50930oai:repositorio.uniandes.edu.co:1992/509302024-03-13 12:06:36.98https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |