Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents
The thesis develops an ideal inverse-dynamics learning algorithm which can learn the properties of the sensors and actuators under its control. The algorithm converges on an ideal feature space, where the implementation details of the actuators under the algorithm's control are rendered invisib...
- Autores:
-
Orozco García, Tomás
- Tipo de recurso:
- Fecha de publicación:
- 2020
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/50981
- Acceso en línea:
- http://hdl.handle.net/1992/50981
- Palabra clave:
- Aprendizaje por refuerzo (Aprendizaje automático)
Aprendizaje automático (Inteligencia artificial)
Aprendizaje impulsado por la curiosidad
Algoritmos (Computadores)
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_4afb929e73fd20e065cc944137dd9f15 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/50981 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
title |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
spellingShingle |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents Aprendizaje por refuerzo (Aprendizaje automático) Aprendizaje automático (Inteligencia artificial) Aprendizaje impulsado por la curiosidad Algoritmos (Computadores) Ingeniería |
title_short |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
title_full |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
title_fullStr |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
title_full_unstemmed |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
title_sort |
Building perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agents |
dc.creator.fl_str_mv |
Orozco García, Tomás |
dc.contributor.advisor.none.fl_str_mv |
Cardozo Álvarez, Nicolás |
dc.contributor.author.none.fl_str_mv |
Orozco García, Tomás |
dc.contributor.jury.none.fl_str_mv |
Mariño Drews, Olga Dusparic, Ivana |
dc.subject.armarc.es_CO.fl_str_mv |
Aprendizaje por refuerzo (Aprendizaje automático) Aprendizaje automático (Inteligencia artificial) Aprendizaje impulsado por la curiosidad Algoritmos (Computadores) |
topic |
Aprendizaje por refuerzo (Aprendizaje automático) Aprendizaje automático (Inteligencia artificial) Aprendizaje impulsado por la curiosidad Algoritmos (Computadores) Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
The thesis develops an ideal inverse-dynamics learning algorithm which can learn the properties of the sensors and actuators under its control. The algorithm converges on an ideal feature space, where the implementation details of the actuators under the algorithm's control are rendered invisible to the forward dynamics of a curiosity-driven algorithm (with the same sensors and actuators), run on top of that feature space, where the curiosity-driven algorithm's reward is strictly determined by the minimization of the error of his prediction of the next state of his environment given the current state and his action. That is, the ideal feature space allows the learning trajectory of the forward dynamics of a curiosity-driven algorithm to concentrate on the dynamics of the algorithm's environment by avoiding any distractions originating in the properties of the sensors and actuators under the algorithm's control. |
publishDate |
2020 |
dc.date.issued.none.fl_str_mv |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-08-10T18:05:25Z |
dc.date.available.none.fl_str_mv |
2021-08-10T18:05:25Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/50981 |
dc.identifier.pdf.none.fl_str_mv |
22826.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/50981 |
identifier_str_mv |
22826.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
72 hojas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Maestría en Ingeniería de Sistemas y Computación |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/f48e1ed4-77c0-4045-aac9-4d615c7ae65d/download https://repositorio.uniandes.edu.co/bitstreams/e7f8e771-c24a-4e88-98c7-0ceea0a419e1/download https://repositorio.uniandes.edu.co/bitstreams/52baab7f-1186-46ee-ad28-01e40f25077c/download |
bitstream.checksum.fl_str_mv |
a282f46ed9ca5c0b86aa558f8c1c8394 8d770ec793b4e53dbfcfbfa4f8ea5bc5 fe5cfc4cc1b8ef86d73b64644ce58741 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133942553214976 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Cardozo Álvarez, Nicolásvirtual::9085-1Orozco García, Tomás1234cdb4-0a6a-470f-9d64-86d694bc585f500Mariño Drews, OlgaDusparic, Ivana2021-08-10T18:05:25Z2021-08-10T18:05:25Z2020http://hdl.handle.net/1992/5098122826.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/The thesis develops an ideal inverse-dynamics learning algorithm which can learn the properties of the sensors and actuators under its control. The algorithm converges on an ideal feature space, where the implementation details of the actuators under the algorithm's control are rendered invisible to the forward dynamics of a curiosity-driven algorithm (with the same sensors and actuators), run on top of that feature space, where the curiosity-driven algorithm's reward is strictly determined by the minimization of the error of his prediction of the next state of his environment given the current state and his action. That is, the ideal feature space allows the learning trajectory of the forward dynamics of a curiosity-driven algorithm to concentrate on the dynamics of the algorithm's environment by avoiding any distractions originating in the properties of the sensors and actuators under the algorithm's control.La tesis desarrolla un algoritmo de aprendizaje ideal de dinámica inversa que puede aprender las propiedades de los sensores y actuadores bajo su control. El algoritmo converge en un espacio de características ideal, en el cual los detalles de implementación de los actuadores bajo el control del algoritmo se vuelven invisibles para la dinámica delantera de un algoritmo motivado por curiosidad (con los mismos sensores y actuadores). El algoritmo motivado por curiosidad corre sobre el espacio de características al que converge el algoritmo de dinámica inversa, y la recompensa del algoritmo motivado por curiosidad está estrictamente determinada por la minimización del error de sus predicciones del próximo estado del ambiente dado el estado actual y su acción. Esto es: el espacio de carcaterísticas ideal permite que la trayectoria de aprendizaje de la dinámica delantera de un algoritmo motivado por curiosidad se concentre en las propiedades de la dinámica del ambiente del algoritmo y evite distracciones provenientes de las propiedades de los sensores y actuadores bajo el control del algoritmo.Magíster en Ingeniería de Sistemas y ComputaciónMaestría72 hojasapplication/pdfengUniversidad de los AndesMaestría en Ingeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónBuilding perfectly curious machines: using structural causal modeling to define the ideal feature space at the learning baseline of curiosity-driven agentsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMAprendizaje por refuerzo (Aprendizaje automático)Aprendizaje automático (Inteligencia artificial)Aprendizaje impulsado por la curiosidadAlgoritmos (Computadores)Ingeniería200923093Publicationhttps://scholar.google.es/citations?user=3iTzjQsAAAAJvirtual::9085-10000-0002-1094-9952virtual::9085-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::9085-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::9085-1ORIGINAL22826.pdfapplication/pdf715039https://repositorio.uniandes.edu.co/bitstreams/f48e1ed4-77c0-4045-aac9-4d615c7ae65d/downloada282f46ed9ca5c0b86aa558f8c1c8394MD51THUMBNAIL22826.pdf.jpg22826.pdf.jpgIM Thumbnailimage/jpeg9731https://repositorio.uniandes.edu.co/bitstreams/e7f8e771-c24a-4e88-98c7-0ceea0a419e1/download8d770ec793b4e53dbfcfbfa4f8ea5bc5MD55TEXT22826.pdf.txt22826.pdf.txtExtracted texttext/plain158575https://repositorio.uniandes.edu.co/bitstreams/52baab7f-1186-46ee-ad28-01e40f25077c/downloadfe5cfc4cc1b8ef86d73b64644ce58741MD541992/50981oai:repositorio.uniandes.edu.co:1992/509812024-03-13 13:50:40.784http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |