Uso de deep reinforcement Learning en Pacman
En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de ite...
- Autores:
-
Osorio Algarra, Samuel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/64256
- Acceso en línea:
- http://hdl.handle.net/1992/64256
- Palabra clave:
- Inteligencia artificial
Deep reinforcement Learning
Pacman
Dqn
Ingeniería
- Rights
- openAccess
- License
- Atribución 4.0 Internacional
id |
UNIANDES2_18971387bd7385d07c25647f0c3d1857 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/64256 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.none.fl_str_mv |
Uso de deep reinforcement Learning en Pacman |
title |
Uso de deep reinforcement Learning en Pacman |
spellingShingle |
Uso de deep reinforcement Learning en Pacman Inteligencia artificial Deep reinforcement Learning Pacman Dqn Ingeniería |
title_short |
Uso de deep reinforcement Learning en Pacman |
title_full |
Uso de deep reinforcement Learning en Pacman |
title_fullStr |
Uso de deep reinforcement Learning en Pacman |
title_full_unstemmed |
Uso de deep reinforcement Learning en Pacman |
title_sort |
Uso de deep reinforcement Learning en Pacman |
dc.creator.fl_str_mv |
Osorio Algarra, Samuel |
dc.contributor.advisor.none.fl_str_mv |
Takahashi Rodríguez, Silvia |
dc.contributor.author.none.fl_str_mv |
Osorio Algarra, Samuel |
dc.subject.keyword.none.fl_str_mv |
Inteligencia artificial Deep reinforcement Learning Pacman Dqn |
topic |
Inteligencia artificial Deep reinforcement Learning Pacman Dqn Ingeniería |
dc.subject.themes.es_CO.fl_str_mv |
Ingeniería |
description |
En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento. |
publishDate |
2022 |
dc.date.issued.none.fl_str_mv |
2022-12-16 |
dc.date.accessioned.none.fl_str_mv |
2023-01-26T20:47:43Z |
dc.date.available.none.fl_str_mv |
2023-01-26T20:47:43Z |
dc.type.es_CO.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.es_CO.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/64256 |
dc.identifier.instname.es_CO.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.es_CO.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.es_CO.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/64256 |
identifier_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.relation.references.es_CO.fl_str_mv |
Khanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8 Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:. Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes. Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv. Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance. Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press. Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292. Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size |
dc.rights.license.spa.fl_str_mv |
Atribución 4.0 Internacional |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución 4.0 Internacional http://creativecommons.org/licenses/by/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
43 Páginas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería Sistemas y Computación |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/download https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/download https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download |
bitstream.checksum.fl_str_mv |
0175ea4a2d4caec4bbcc37e300941108 4f573f72b2d2b2c071f6703c3a316f0b 851e4798a7cf41ed674fe6116e1c820a 08b91b3ffee0748d6a4004c0197d6c31 ea53e16813249ebc5854ff206ac16475 5aa5c691a1ffe97abd12c2966efcb8d6 a5e2c66139ba685a552634341d50a896 4dd99132d5474042584a5290c376665e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133806099922944 |
spelling |
Atribución 4.0 Internacionalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Takahashi Rodríguez, Silviavirtual::928-1Osorio Algarra, Samuel3c24e5cb-26cb-4e58-bcc4-f89762c740a76002023-01-26T20:47:43Z2023-01-26T20:47:43Z2022-12-16http://hdl.handle.net/1992/64256instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento.Ingeniero de Sistemas y ComputaciónPregrado43 Páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería Sistemas y ComputaciónUso de deep reinforcement Learning en PacmanTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPInteligencia artificialDeep reinforcement LearningPacmanDqnIngenieríaKhanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:.Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes.Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv.Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance.Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292.Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size201730074Publicationhttps://scholar.google.es/citations?user=x7gjZ04AAAAJvirtual::928-10000-0001-7971-8979virtual::928-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143898virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-1CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download0175ea4a2d4caec4bbcc37e300941108MD54ORIGINALTesis.pdfTesis.pdfapplication/pdf748216https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download4f573f72b2d2b2c071f6703c3a316f0bMD57AutorizacionTesis.pdfAutorizacionTesis.pdfHIDEapplication/pdf221318https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download851e4798a7cf41ed674fe6116e1c820aMD56TEXTTesis.pdf.txtTesis.pdf.txtExtracted texttext/plain52171https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download08b91b3ffee0748d6a4004c0197d6c31MD58AutorizacionTesis.pdf.txtAutorizacionTesis.pdf.txtExtracted texttext/plain1177https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/downloadea53e16813249ebc5854ff206ac16475MD510LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download5aa5c691a1ffe97abd12c2966efcb8d6MD51THUMBNAILTesis.pdf.jpgTesis.pdf.jpgIM Thumbnailimage/jpeg9281https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/downloada5e2c66139ba685a552634341d50a896MD59AutorizacionTesis.pdf.jpgAutorizacionTesis.pdf.jpgIM Thumbnailimage/jpeg13672https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download4dd99132d5474042584a5290c376665eMD5111992/64256oai:repositorio.uniandes.edu.co:1992/642562024-03-13 11:50:35.073http://creativecommons.org/licenses/by/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg== |