Transfer learning in reinforcement learning for image-based environments: An image to image translation approach

Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es...

Full description

Autores:: Sosa Flórez, Juan Sebastian

Tipo de recurso:: Trabajo de grado de pregrado

Fecha de publicación:: 2019

Institución:: Universidad de los Andes

Repositorio:: Séneca: repositorio Uniandes

Idioma:: eng

id	UNIANDES2_9d03c2c516be244e22b341033e316cc6
oai_identifier_str	oai:repositorio.uniandes.edu.co:1992/44926
network_acronym_str	UNIANDES2
network_name_str	Séneca: repositorio Uniandes
repository_id_str
spelling	Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::13819-1Sosa Flórez, Juan Sebastian29b689e0-0184-4164-8607-e12d24f4ca6f5002020-09-03T15:06:36Z2020-09-03T15:06:36Z2019http://hdl.handle.net/1992/44926u831221.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente.Reinforcement learning algorithms allow humans to create agents able to interact in a smart way with a variety of environments. However, due the lack of gener- alization of these algorithms, trained agents fail in related tasks. This problem is even more evident in image-based environments such as video games, where an agent trained in a level fails to play the next level of the game. In order to tackle this problem we propose an image-to-image translation based method that enables us to retrieve key knowledge from an agent trained in a source task and use it to speed up and improve the training in the target task. We validate our method in the super Mario Bros environment running on the OpenAI Gym toolkit. We use the first and second levels of the game as source and target tasks respectively.Ingeniero EléctricoPregrado31 hojasapplication/pdfengUniversidad de los AndesIngeniería EléctricaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTransfer learning in reinforcement learning for image-based environments: An image to image translation approachTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzo (Aprendizaje automático)IngenieríaPublicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::13819-1ORIGINALu831221.pdfapplication/pdf2276975https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download6d2d853413c5ae9e48648327b3290321MD51THUMBNAILu831221.pdf.jpgu831221.pdf.jpgIM Thumbnailimage/jpeg10681https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/downloadfadccfc78a5c8c5a4335e41df4fedb85MD55TEXTu831221.pdf.txtu831221.pdf.txtExtracted texttext/plain35753https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download41eba48a6c33532325f92b57f8f91621MD541992/44926oai:repositorio.uniandes.edu.co:1992/449262024-03-13 15:02:13.375https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co
dc.title.es_CO.fl_str_mv	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
spellingShingle	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería
title_short	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_full	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_fullStr	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_full_unstemmed	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
title_sort	Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
dc.creator.fl_str_mv	Sosa Flórez, Juan Sebastian
dc.contributor.advisor.none.fl_str_mv	Higuera Arias, Carolina Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv	Sosa Flórez, Juan Sebastian
dc.subject.armarc.es_CO.fl_str_mv	Aprendizaje por refuerzo (Aprendizaje automático)
topic	Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería
dc.subject.themes.none.fl_str_mv	Ingeniería
description	Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente.
publishDate	2019
dc.date.issued.none.fl_str_mv	2019
dc.date.accessioned.none.fl_str_mv	2020-09-03T15:06:36Z
dc.date.available.none.fl_str_mv	2020-09-03T15:06:36Z
dc.type.spa.fl_str_mv	Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv	http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv	info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv	http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv	Text
dc.type.redcol.spa.fl_str_mv	http://purl.org/redcol/resource_type/TP
format	http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv	http://hdl.handle.net/1992/44926
dc.identifier.pdf.none.fl_str_mv	u831221.pdf
dc.identifier.instname.spa.fl_str_mv	instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv	reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv	repourl:https://repositorio.uniandes.edu.co/
url	http://hdl.handle.net/1992/44926
identifier_str_mv	u831221.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv	eng
language	eng
dc.rights.uri.*.fl_str_mv	https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv	info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv	http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv	https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv	openAccess
dc.format.extent.es_CO.fl_str_mv	31 hojas
dc.format.mimetype.es_CO.fl_str_mv	application/pdf
dc.publisher.es_CO.fl_str_mv	Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv	Ingeniería Eléctrica
dc.publisher.faculty.es_CO.fl_str_mv	Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv	Departamento de Ingeniería Eléctrica y Electrónica
dc.source.es_CO.fl_str_mv	instname:Universidad de los Andes reponame:Repositorio Institucional Séneca
instname_str	Universidad de los Andes
institution	Universidad de los Andes
reponame_str	Repositorio Institucional Séneca
collection	Repositorio Institucional Séneca
bitstream.url.fl_str_mv	https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/download https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download
bitstream.checksum.fl_str_mv	6d2d853413c5ae9e48648327b3290321 fadccfc78a5c8c5a4335e41df4fedb85 41eba48a6c33532325f92b57f8f91621
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio institucional Séneca
repository.mail.fl_str_mv	adminrepositorio@uniandes.edu.co
_version_	1837005365353381888

Transfer learning in reinforcement learning for image-based environments: An image to image translation approach

Publicaciones similares