Learning for safety

Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the...

Full description

Autores:
Montenegro González, Carlos Andrés
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/50930
Acceso en línea:
http://hdl.handle.net/1992/50930
Palabra clave:
Algoritmos (Computadores)
Aprendizaje por refuerzo (Aprendizaje automático)
Sistemas de control por retroalimentación
Funciones de Liapunov
Robótica
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_7f3139736595e839ddb3746c65b821d5
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/50930
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Learning for safety
title Learning for safety
spellingShingle Learning for safety
Algoritmos (Computadores)
Aprendizaje por refuerzo (Aprendizaje automático)
Sistemas de control por retroalimentación
Funciones de Liapunov
Robótica
Ingeniería
title_short Learning for safety
title_full Learning for safety
title_fullStr Learning for safety
title_full_unstemmed Learning for safety
title_sort Learning for safety
dc.creator.fl_str_mv Montenegro González, Carlos Andrés
dc.contributor.advisor.none.fl_str_mv Rodríguez Herrera, Carlos Francisco
Jiménez Leudo, Santiago
dc.contributor.author.none.fl_str_mv Montenegro González, Carlos Andrés
dc.contributor.jury.none.fl_str_mv Saoud, Adnane
dc.subject.armarc.es_CO.fl_str_mv Algoritmos (Computadores)
Aprendizaje por refuerzo (Aprendizaje automático)
Sistemas de control por retroalimentación
Funciones de Liapunov
Robótica
topic Algoritmos (Computadores)
Aprendizaje por refuerzo (Aprendizaje automático)
Sistemas de control por retroalimentación
Funciones de Liapunov
Robótica
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the performance. Reinforcement Learning (RL) algorithms, on the other hand, have found success in controlling systems with no model at all but it is limited beyond simulated applications, and one main reason is the absence of safety and stability guarantees during the learning process. To address this issue, we complement a controller architecture that combines a model-free RL-based controller with model-based controllers utilizing control-Lyapunov and control-Barrier functions (CLFs and CBFs, respectively) and online learning of the unknown system dynamics, to guarantee stability and safety during learning.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-08-10T18:04:17Z
dc.date.available.none.fl_str_mv 2021-08-10T18:04:17Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/50930
dc.identifier.pdf.none.fl_str_mv 23721.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/50930
identifier_str_mv 23721.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 22 hojas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Maestría en Ingeniería Mecánica
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería Mecánica
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/cb37b342-bfb4-41ad-a61e-df1d86d22762/download
https://repositorio.uniandes.edu.co/bitstreams/46f66ce4-2845-4037-9fbb-5063c037abdd/download
https://repositorio.uniandes.edu.co/bitstreams/1741d927-aea3-468e-8f00-95bb9ac65c73/download
bitstream.checksum.fl_str_mv ad729cc0c6865be2fe018d3cf8e30a9c
90ea4f096631284fddeadf7019f920dd
da08dc48f274b477fc692a6f1b63f3a6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133824875724800
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Rodríguez Herrera, Carlos Franciscovirtual::2036-1Jiménez Leudo, Santiagovirtual::2037-1Montenegro González, Carlos Andrés9ef5ad50-09fc-4f3c-80c3-4b8742261846400Saoud, Adnane2021-08-10T18:04:17Z2021-08-10T18:04:17Z2021http://hdl.handle.net/1992/5093023721.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe and stable controllers, leading to degradation in the performance. Reinforcement Learning (RL) algorithms, on the other hand, have found success in controlling systems with no model at all but it is limited beyond simulated applications, and one main reason is the absence of safety and stability guarantees during the learning process. To address this issue, we complement a controller architecture that combines a model-free RL-based controller with model-based controllers utilizing control-Lyapunov and control-Barrier functions (CLFs and CBFs, respectively) and online learning of the unknown system dynamics, to guarantee stability and safety during learning.La teoría de control no lineal moderna busca dotar a los sistemas de propiedades de estabilidad y seguridad, y se ha desplegado con éxito en múltiples dominios. A pesar de este éxito, la incertidumbre del modelo sigue siendo un reto importante a la hora de sintetizar controladores seguros y estables, lo que provoca una degradación del rendimiento. Los algoritmos de aprendizaje por refuerzo (RL), por otro lado, han tenido éxito en el control de sistemas sin modelo alguno, pero está limitado más allá de las aplicaciones simuladas, y una razón principal es la ausencia de garantías de seguridad y estabilidad durante el proceso de aprendizaje. Para abordar este problema, complementamos una arquitectura de controladores que combina un controlador basado en RL sin modelo con controladores basados en modelos que utilizan funciones de control de Lyapunov y de Barrera (CLFs y CBFs, respectivamente) y el aprendizaje en línea de la dinámica del sistema desconocido, para garantizar la estabilidad y la seguridad durante el aprendizaje.Magíster en Ingeniería MecánicaMaestría22 hojasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería MecánicaFacultad de IngenieríaDepartamento de Ingeniería MecánicaLearning for safetyTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMAlgoritmos (Computadores)Aprendizaje por refuerzo (Aprendizaje automático)Sistemas de control por retroalimentaciónFunciones de LiapunovRobóticaIngeniería201520272Publicationhttps://scholar.google.es/citations?user=O8Cl-rUAAAAJvirtual::2036-10000-0002-7438-8963virtual::2036-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000054020virtual::2036-1e6d7de00-33cf-432f-9b5d-cdcff3b1f6a1virtual::2036-17e80f787-d67a-418f-8b0e-13a177b85c81virtual::2037-1e6d7de00-33cf-432f-9b5d-cdcff3b1f6a1virtual::2036-17e80f787-d67a-418f-8b0e-13a177b85c81virtual::2037-1TEXT23721.pdf.txt23721.pdf.txtExtracted texttext/plain47179https://repositorio.uniandes.edu.co/bitstreams/cb37b342-bfb4-41ad-a61e-df1d86d22762/downloadad729cc0c6865be2fe018d3cf8e30a9cMD54ORIGINAL23721.pdfapplication/pdf663238https://repositorio.uniandes.edu.co/bitstreams/46f66ce4-2845-4037-9fbb-5063c037abdd/download90ea4f096631284fddeadf7019f920ddMD51THUMBNAIL23721.pdf.jpg23721.pdf.jpgIM Thumbnailimage/jpeg16342https://repositorio.uniandes.edu.co/bitstreams/1741d927-aea3-468e-8f00-95bb9ac65c73/downloadda08dc48f274b477fc692a6f1b63f3a6MD551992/50930oai:repositorio.uniandes.edu.co:1992/509302024-03-13 12:06:36.98https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co