Transfer learning in reinforcement learning for image-based environments: An image to image translation approach

Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es...

Full description

Autores:
Sosa Flórez, Juan Sebastian
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/44926
Acceso en línea:
http://hdl.handle.net/1992/44926
Palabra clave:
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_9d03c2c516be244e22b341033e316cc6
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/44926
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::13819-1Sosa Flórez, Juan Sebastian29b689e0-0184-4164-8607-e12d24f4ca6f5002020-09-03T15:06:36Z2020-09-03T15:06:36Z2019http://hdl.handle.net/1992/44926u831221.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente.Reinforcement learning algorithms allow humans to create agents able to interact in a smart way with a variety of environments. However, due the lack of gener- alization of these algorithms, trained agents fail in related tasks. This problem is even more evident in image-based environments such as video games, where an agent trained in a level fails to play the next level of the game. In order to tackle this problem we propose an image-to-image translation based method that enables us to retrieve key knowledge from an agent trained in a source task and use it to speed up and improve the training in the target task. We validate our method in the super Mario Bros environment running on the OpenAI Gym toolkit. We use the first and second levels of the game as source and target tasks respectively.Ingeniero EléctricoPregrado31 hojasapplication/pdfengUniversidad de los AndesIngeniería EléctricaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTransfer learning in reinforcement learning for image-based environments: An image to image translation approachTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzo (Aprendizaje automático)IngenieríaPublicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::13819-1ORIGINALu831221.pdfapplication/pdf2276975https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download6d2d853413c5ae9e48648327b3290321MD51THUMBNAILu831221.pdf.jpgu831221.pdf.jpgIM Thumbnailimage/jpeg10681https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/downloadfadccfc78a5c8c5a4335e41df4fedb85MD55TEXTu831221.pdf.txtu831221.pdf.txtExtracted texttext/plain35753https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download41eba48a6c33532325f92b57f8f91621MD541992/44926oai:repositorio.uniandes.edu.co:1992/449262024-03-13 15:02:13.375https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co
dc.title.es_CO.fl_str_mv Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
spellingShingle Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
title_short Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_full Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_fullStr Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_full_unstemmed Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_sort Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
dc.creator.fl_str_mv Sosa Flórez, Juan Sebastian
dc.contributor.advisor.none.fl_str_mv Higuera Arias, Carolina
Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Sosa Flórez, Juan Sebastian
dc.subject.armarc.es_CO.fl_str_mv Aprendizaje por refuerzo (Aprendizaje automático)
topic Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente.
publishDate 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2020-09-03T15:06:36Z
dc.date.available.none.fl_str_mv 2020-09-03T15:06:36Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/44926
dc.identifier.pdf.none.fl_str_mv u831221.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/44926
identifier_str_mv u831221.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 31 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería Eléctrica
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download
https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/download
https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download
bitstream.checksum.fl_str_mv 6d2d853413c5ae9e48648327b3290321
fadccfc78a5c8c5a4335e41df4fedb85
41eba48a6c33532325f92b57f8f91621
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812134018590703616