Applying deep reinforcement learning to Berkeley's capture the flag game

"This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network w...

Full description

Autores:
Rojas Herrera, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/39251
Acceso en línea:
http://hdl.handle.net/1992/39251
Palabra clave:
Aprendizaje por refuerzo (Aprendizaje automático)
Agentes inteligentes (Programas para computador)
Redes neurales (Computadores)
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_74707679e16aa7387775e181693fc655
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/39251
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Takahashi Rodríguez, Silviavirtual::4367-1Rojas Herrera, Santiago5478519c-9e9d-4cc3-b442-13f44069d3b15002020-06-10T16:07:51Z2020-06-10T16:07:51Z2019http://hdl.handle.net/1992/39251u821151.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/"This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network was studied. Then, multiple agents that used different exploring strategies and different reward functions were trained, with the purpose of finding the most effective way to train agents for this game."--Tomado del Formato de Documento de Grado."Este proyecto buscó aplicar métodos de Deep Reinforcement Learning en Capturar la Bandera, un juego diseñado para la clase de Introducción a la Inteligencia Artificial (CS188) de Berkeley. Adicionalmente, se estudió el potencial de generar imágenes a partir de la información del estado del juego, y usar estas imágenes como entradas a una red neuronal. Después, se entrenaron múltiples agentes usando distintas estrategias de exploración y distintas funciones de recompensa, con el propósito de encontrar la forma más efectiva de entrenar agentes para este juego."--Tomado del Formato de Documento de Grado.Ingeniero de Sistemas y ComputaciónPregrado35 hojasapplication/pdfengUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaApplying deep reinforcement learning to Berkeley's capture the flag gameTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzo (Aprendizaje automático)Agentes inteligentes (Programas para computador)Redes neurales (Computadores)IngenieríaPublicationhttps://scholar.google.es/citations?user=x7gjZ04AAAAJvirtual::4367-10000-0001-7971-8979virtual::4367-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143898virtual::4367-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::4367-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::4367-1ORIGINALu821151.pdfapplication/pdf2011257https://repositorio.uniandes.edu.co/bitstreams/7a6fe3ef-f898-4c4e-bbe0-82bca98dfe27/downloade86882d868dfd1e987c976f59d69cf42MD51THUMBNAILu821151.pdf.jpgu821151.pdf.jpgIM Thumbnailimage/jpeg9403https://repositorio.uniandes.edu.co/bitstreams/19654fa6-2563-4842-ac29-6333fb1b4319/download45a27377258d5fb949bbc5a0097f7e06MD55TEXTu821151.pdf.txtu821151.pdf.txtExtracted texttext/plain58551https://repositorio.uniandes.edu.co/bitstreams/4c0aa94c-db0e-400b-abfe-06d2844f5277/download596f829272091e2dd4c7467cfc8a9c79MD541992/39251oai:repositorio.uniandes.edu.co:1992/392512024-03-13 12:40:13.587http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co
dc.title.es_CO.fl_str_mv Applying deep reinforcement learning to Berkeley's capture the flag game
title Applying deep reinforcement learning to Berkeley's capture the flag game
spellingShingle Applying deep reinforcement learning to Berkeley's capture the flag game
Aprendizaje por refuerzo (Aprendizaje automático)
Agentes inteligentes (Programas para computador)
Redes neurales (Computadores)
Ingeniería
title_short Applying deep reinforcement learning to Berkeley's capture the flag game
title_full Applying deep reinforcement learning to Berkeley's capture the flag game
title_fullStr Applying deep reinforcement learning to Berkeley's capture the flag game
title_full_unstemmed Applying deep reinforcement learning to Berkeley's capture the flag game
title_sort Applying deep reinforcement learning to Berkeley's capture the flag game
dc.creator.fl_str_mv Rojas Herrera, Santiago
dc.contributor.advisor.none.fl_str_mv Takahashi Rodríguez, Silvia
dc.contributor.author.none.fl_str_mv Rojas Herrera, Santiago
dc.subject.keyword.es_CO.fl_str_mv Aprendizaje por refuerzo (Aprendizaje automático)
Agentes inteligentes (Programas para computador)
Redes neurales (Computadores)
topic Aprendizaje por refuerzo (Aprendizaje automático)
Agentes inteligentes (Programas para computador)
Redes neurales (Computadores)
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description "This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network was studied. Then, multiple agents that used different exploring strategies and different reward functions were trained, with the purpose of finding the most effective way to train agents for this game."--Tomado del Formato de Documento de Grado.
publishDate 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2020-06-10T16:07:51Z
dc.date.available.none.fl_str_mv 2020-06-10T16:07:51Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/39251
dc.identifier.pdf.none.fl_str_mv u821151.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/39251
identifier_str_mv u821151.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 35 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/7a6fe3ef-f898-4c4e-bbe0-82bca98dfe27/download
https://repositorio.uniandes.edu.co/bitstreams/19654fa6-2563-4842-ac29-6333fb1b4319/download
https://repositorio.uniandes.edu.co/bitstreams/4c0aa94c-db0e-400b-abfe-06d2844f5277/download
bitstream.checksum.fl_str_mv e86882d868dfd1e987c976f59d69cf42
45a27377258d5fb949bbc5a0097f7e06
596f829272091e2dd4c7467cfc8a9c79
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133865569910784