Uso de deep reinforcement Learning en Pacman

En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de ite...

Full description

Autores:
Osorio Algarra, Samuel
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/64256
Acceso en línea:
http://hdl.handle.net/1992/64256
Palabra clave:
Inteligencia artificial
Deep reinforcement Learning
Pacman
Dqn
Ingeniería
Rights
openAccess
License
Atribución 4.0 Internacional
id UNIANDES2_18971387bd7385d07c25647f0c3d1857
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/64256
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.none.fl_str_mv Uso de deep reinforcement Learning en Pacman
title Uso de deep reinforcement Learning en Pacman
spellingShingle Uso de deep reinforcement Learning en Pacman
Inteligencia artificial
Deep reinforcement Learning
Pacman
Dqn
Ingeniería
title_short Uso de deep reinforcement Learning en Pacman
title_full Uso de deep reinforcement Learning en Pacman
title_fullStr Uso de deep reinforcement Learning en Pacman
title_full_unstemmed Uso de deep reinforcement Learning en Pacman
title_sort Uso de deep reinforcement Learning en Pacman
dc.creator.fl_str_mv Osorio Algarra, Samuel
dc.contributor.advisor.none.fl_str_mv Takahashi Rodríguez, Silvia
dc.contributor.author.none.fl_str_mv Osorio Algarra, Samuel
dc.subject.keyword.none.fl_str_mv Inteligencia artificial
Deep reinforcement Learning
Pacman
Dqn
topic Inteligencia artificial
Deep reinforcement Learning
Pacman
Dqn
Ingeniería
dc.subject.themes.es_CO.fl_str_mv Ingeniería
description En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento.
publishDate 2022
dc.date.issued.none.fl_str_mv 2022-12-16
dc.date.accessioned.none.fl_str_mv 2023-01-26T20:47:43Z
dc.date.available.none.fl_str_mv 2023-01-26T20:47:43Z
dc.type.es_CO.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.es_CO.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/64256
dc.identifier.instname.es_CO.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.es_CO.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.es_CO.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/64256
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.relation.references.es_CO.fl_str_mv Khanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8
Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:.
Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes.
Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv.
Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance.
Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292.
Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size
dc.rights.license.spa.fl_str_mv Atribución 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución 4.0 Internacional
http://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 43 Páginas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería Sistemas y Computación
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download
https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download
https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download
https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download
https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/download
https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download
https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/download
https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download
bitstream.checksum.fl_str_mv 0175ea4a2d4caec4bbcc37e300941108
4f573f72b2d2b2c071f6703c3a316f0b
851e4798a7cf41ed674fe6116e1c820a
08b91b3ffee0748d6a4004c0197d6c31
ea53e16813249ebc5854ff206ac16475
5aa5c691a1ffe97abd12c2966efcb8d6
a5e2c66139ba685a552634341d50a896
4dd99132d5474042584a5290c376665e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133806099922944
spelling Atribución 4.0 Internacionalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Takahashi Rodríguez, Silviavirtual::928-1Osorio Algarra, Samuel3c24e5cb-26cb-4e58-bcc4-f89762c740a76002023-01-26T20:47:43Z2023-01-26T20:47:43Z2022-12-16http://hdl.handle.net/1992/64256instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento.Ingeniero de Sistemas y ComputaciónPregrado43 Páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería Sistemas y ComputaciónUso de deep reinforcement Learning en PacmanTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPInteligencia artificialDeep reinforcement LearningPacmanDqnIngenieríaKhanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:.Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes.Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv.Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance.Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292.Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size201730074Publicationhttps://scholar.google.es/citations?user=x7gjZ04AAAAJvirtual::928-10000-0001-7971-8979virtual::928-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143898virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-1CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download0175ea4a2d4caec4bbcc37e300941108MD54ORIGINALTesis.pdfTesis.pdfapplication/pdf748216https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download4f573f72b2d2b2c071f6703c3a316f0bMD57AutorizacionTesis.pdfAutorizacionTesis.pdfHIDEapplication/pdf221318https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download851e4798a7cf41ed674fe6116e1c820aMD56TEXTTesis.pdf.txtTesis.pdf.txtExtracted texttext/plain52171https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download08b91b3ffee0748d6a4004c0197d6c31MD58AutorizacionTesis.pdf.txtAutorizacionTesis.pdf.txtExtracted texttext/plain1177https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/downloadea53e16813249ebc5854ff206ac16475MD510LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download5aa5c691a1ffe97abd12c2966efcb8d6MD51THUMBNAILTesis.pdf.jpgTesis.pdf.jpgIM Thumbnailimage/jpeg9281https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/downloada5e2c66139ba685a552634341d50a896MD59AutorizacionTesis.pdf.jpgAutorizacionTesis.pdf.jpgIM Thumbnailimage/jpeg13672https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download4dd99132d5474042584a5290c376665eMD5111992/64256oai:repositorio.uniandes.edu.co:1992/642562024-03-13 11:50:35.073http://creativecommons.org/licenses/by/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg==