Applying deep reinforcement learning to Berkeley's capture the flag game
"This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network w...
- Autores:
-
Rojas Herrera, Santiago
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/39251
- Acceso en línea:
- http://hdl.handle.net/1992/39251
- Palabra clave:
- Aprendizaje por refuerzo (Aprendizaje automático)
Agentes inteligentes (Programas para computador)
Redes neurales (Computadores)
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_74707679e16aa7387775e181693fc655 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/39251 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Takahashi Rodríguez, Silviavirtual::4367-1Rojas Herrera, Santiago5478519c-9e9d-4cc3-b442-13f44069d3b15002020-06-10T16:07:51Z2020-06-10T16:07:51Z2019http://hdl.handle.net/1992/39251u821151.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/"This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network was studied. Then, multiple agents that used different exploring strategies and different reward functions were trained, with the purpose of finding the most effective way to train agents for this game."--Tomado del Formato de Documento de Grado."Este proyecto buscó aplicar métodos de Deep Reinforcement Learning en Capturar la Bandera, un juego diseñado para la clase de Introducción a la Inteligencia Artificial (CS188) de Berkeley. Adicionalmente, se estudió el potencial de generar imágenes a partir de la información del estado del juego, y usar estas imágenes como entradas a una red neuronal. Después, se entrenaron múltiples agentes usando distintas estrategias de exploración y distintas funciones de recompensa, con el propósito de encontrar la forma más efectiva de entrenar agentes para este juego."--Tomado del Formato de Documento de Grado.Ingeniero de Sistemas y ComputaciónPregrado35 hojasapplication/pdfengUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaApplying deep reinforcement learning to Berkeley's capture the flag gameTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzo (Aprendizaje automático)Agentes inteligentes (Programas para computador)Redes neurales (Computadores)IngenieríaPublicationhttps://scholar.google.es/citations?user=x7gjZ04AAAAJvirtual::4367-10000-0001-7971-8979virtual::4367-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143898virtual::4367-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::4367-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::4367-1ORIGINALu821151.pdfapplication/pdf2011257https://repositorio.uniandes.edu.co/bitstreams/7a6fe3ef-f898-4c4e-bbe0-82bca98dfe27/downloade86882d868dfd1e987c976f59d69cf42MD51THUMBNAILu821151.pdf.jpgu821151.pdf.jpgIM Thumbnailimage/jpeg9403https://repositorio.uniandes.edu.co/bitstreams/19654fa6-2563-4842-ac29-6333fb1b4319/download45a27377258d5fb949bbc5a0097f7e06MD55TEXTu821151.pdf.txtu821151.pdf.txtExtracted texttext/plain58551https://repositorio.uniandes.edu.co/bitstreams/4c0aa94c-db0e-400b-abfe-06d2844f5277/download596f829272091e2dd4c7467cfc8a9c79MD541992/39251oai:repositorio.uniandes.edu.co:1992/392512024-03-13 12:40:13.587http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |
dc.title.es_CO.fl_str_mv |
Applying deep reinforcement learning to Berkeley's capture the flag game |
title |
Applying deep reinforcement learning to Berkeley's capture the flag game |
spellingShingle |
Applying deep reinforcement learning to Berkeley's capture the flag game Aprendizaje por refuerzo (Aprendizaje automático) Agentes inteligentes (Programas para computador) Redes neurales (Computadores) Ingeniería |
title_short |
Applying deep reinforcement learning to Berkeley's capture the flag game |
title_full |
Applying deep reinforcement learning to Berkeley's capture the flag game |
title_fullStr |
Applying deep reinforcement learning to Berkeley's capture the flag game |
title_full_unstemmed |
Applying deep reinforcement learning to Berkeley's capture the flag game |
title_sort |
Applying deep reinforcement learning to Berkeley's capture the flag game |
dc.creator.fl_str_mv |
Rojas Herrera, Santiago |
dc.contributor.advisor.none.fl_str_mv |
Takahashi Rodríguez, Silvia |
dc.contributor.author.none.fl_str_mv |
Rojas Herrera, Santiago |
dc.subject.keyword.es_CO.fl_str_mv |
Aprendizaje por refuerzo (Aprendizaje automático) Agentes inteligentes (Programas para computador) Redes neurales (Computadores) |
topic |
Aprendizaje por refuerzo (Aprendizaje automático) Agentes inteligentes (Programas para computador) Redes neurales (Computadores) Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
"This project aimed to apply Deep Reinforcement Learning methods on Capture the Flag, a game designed for Berkeley's Introduction to AI (CS188) class. Furthermore, the potential of generating images from the state information of the game and using these as inputs to a Deep Neural Network was studied. Then, multiple agents that used different exploring strategies and different reward functions were trained, with the purpose of finding the most effective way to train agents for this game."--Tomado del Formato de Documento de Grado. |
publishDate |
2019 |
dc.date.issued.none.fl_str_mv |
2019 |
dc.date.accessioned.none.fl_str_mv |
2020-06-10T16:07:51Z |
dc.date.available.none.fl_str_mv |
2020-06-10T16:07:51Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/39251 |
dc.identifier.pdf.none.fl_str_mv |
u821151.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/39251 |
identifier_str_mv |
u821151.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
35 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/7a6fe3ef-f898-4c4e-bbe0-82bca98dfe27/download https://repositorio.uniandes.edu.co/bitstreams/19654fa6-2563-4842-ac29-6333fb1b4319/download https://repositorio.uniandes.edu.co/bitstreams/4c0aa94c-db0e-400b-abfe-06d2844f5277/download |
bitstream.checksum.fl_str_mv |
e86882d868dfd1e987c976f59d69cf42 45a27377258d5fb949bbc5a0097f7e06 596f829272091e2dd4c7467cfc8a9c79 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133865569910784 |