Transfer learning in reinforcement learning for image-based environments: An image to image translation approach
Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es...
- Autores:
-
Sosa Flórez, Juan Sebastian
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/44926
- Acceso en línea:
- http://hdl.handle.net/1992/44926
- Palabra clave:
- Aprendizaje por refuerzo (Aprendizaje automático)
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id |
UNIANDES2_9d03c2c516be244e22b341033e316cc6 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/44926 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Higuera Arias, Carolina70d68b14-b3a4-486e-9300-cadce1c3c686500Lozano Martínez, Fernando Enriquevirtual::13819-1Sosa Flórez, Juan Sebastian29b689e0-0184-4164-8607-e12d24f4ca6f5002020-09-03T15:06:36Z2020-09-03T15:06:36Z2019http://hdl.handle.net/1992/44926u831221.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente.Reinforcement learning algorithms allow humans to create agents able to interact in a smart way with a variety of environments. However, due the lack of gener- alization of these algorithms, trained agents fail in related tasks. This problem is even more evident in image-based environments such as video games, where an agent trained in a level fails to play the next level of the game. In order to tackle this problem we propose an image-to-image translation based method that enables us to retrieve key knowledge from an agent trained in a source task and use it to speed up and improve the training in the target task. We validate our method in the super Mario Bros environment running on the OpenAI Gym toolkit. We use the first and second levels of the game as source and target tasks respectively.Ingeniero EléctricoPregrado31 hojasapplication/pdfengUniversidad de los AndesIngeniería EléctricaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTransfer learning in reinforcement learning for image-based environments: An image to image translation approachTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzo (Aprendizaje automático)IngenieríaPublicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::13819-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::13819-1ORIGINALu831221.pdfapplication/pdf2276975https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download6d2d853413c5ae9e48648327b3290321MD51THUMBNAILu831221.pdf.jpgu831221.pdf.jpgIM Thumbnailimage/jpeg10681https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/downloadfadccfc78a5c8c5a4335e41df4fedb85MD55TEXTu831221.pdf.txtu831221.pdf.txtExtracted texttext/plain35753https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download41eba48a6c33532325f92b57f8f91621MD541992/44926oai:repositorio.uniandes.edu.co:1992/449262024-03-13 15:02:13.375https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |
dc.title.es_CO.fl_str_mv |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
title |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
spellingShingle |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería |
title_short |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
title_full |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
title_fullStr |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
title_full_unstemmed |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
title_sort |
Transfer learning in reinforcement learning for image-based environments: An image to image translation approach |
dc.creator.fl_str_mv |
Sosa Flórez, Juan Sebastian |
dc.contributor.advisor.none.fl_str_mv |
Higuera Arias, Carolina Lozano Martínez, Fernando Enrique |
dc.contributor.author.none.fl_str_mv |
Sosa Flórez, Juan Sebastian |
dc.subject.armarc.es_CO.fl_str_mv |
Aprendizaje por refuerzo (Aprendizaje automático) |
topic |
Aprendizaje por refuerzo (Aprendizaje automático) Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Los algoritmos de aprendizaje por refuerzo permiten a los humanos crear agentes capaces de interactuar de manera inteligente con una variedad de entornos. Sin embargo, debido a la falta de generalización de estos algoritmos, los agentes entrenados fallan en las tareas relacionadas. Este problema es aún más evidente en entornos basados en imágenes, como los videojuegos, donde un agente entrenado en un nivel no puede jugar el siguiente nivel del juego. Para abordar este problema, proponemos un método basado en la traducción de imagen a imagen que nos permite recuperar el conocimiento clave de un agente capacitado en una tarea de origen y usarlo para acelerar y mejorar la capacitación en la tarea de destino. Validamos nuestro método en el entorno super Mario Bros que se ejecuta en el kit de herramientas OpenAI Gym. Usamos el primer y segundo nivel del juego como tareas de origen y destino respectivamente. |
publishDate |
2019 |
dc.date.issued.none.fl_str_mv |
2019 |
dc.date.accessioned.none.fl_str_mv |
2020-09-03T15:06:36Z |
dc.date.available.none.fl_str_mv |
2020-09-03T15:06:36Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/44926 |
dc.identifier.pdf.none.fl_str_mv |
u831221.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/44926 |
identifier_str_mv |
u831221.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.*.fl_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
31 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería Eléctrica |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería Eléctrica y Electrónica |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/a944011a-2076-4b31-88f1-48c173eda03b/download https://repositorio.uniandes.edu.co/bitstreams/b034a08b-1f02-4cb2-9f2f-e54b831a725b/download https://repositorio.uniandes.edu.co/bitstreams/11730299-afa2-4df0-9496-2316e1a1678c/download |
bitstream.checksum.fl_str_mv |
6d2d853413c5ae9e48648327b3290321 fadccfc78a5c8c5a4335e41df4fedb85 41eba48a6c33532325f92b57f8f91621 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812134018590703616 |