Uso de deep reinforcement Learning en Pacman

En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de ite...

Full description

Autores:: Osorio Algarra, Samuel

Tipo de recurso:: Trabajo de grado de pregrado

Fecha de publicación:: 2022

Institución:: Universidad de los Andes

Repositorio:: Séneca: repositorio Uniandes

Idioma:: spa

id	UNIANDES2_18971387bd7385d07c25647f0c3d1857
oai_identifier_str	oai:repositorio.uniandes.edu.co:1992/64256
network_acronym_str	UNIANDES2
network_name_str	Séneca: repositorio Uniandes
repository_id_str
dc.title.none.fl_str_mv	Uso de deep reinforcement Learning en Pacman
title	Uso de deep reinforcement Learning en Pacman
spellingShingle	Uso de deep reinforcement Learning en Pacman Inteligencia artificial Deep reinforcement Learning Pacman Dqn Ingeniería
title_short	Uso de deep reinforcement Learning en Pacman
title_full	Uso de deep reinforcement Learning en Pacman
title_fullStr	Uso de deep reinforcement Learning en Pacman
title_full_unstemmed	Uso de deep reinforcement Learning en Pacman
title_sort	Uso de deep reinforcement Learning en Pacman
dc.creator.fl_str_mv	Osorio Algarra, Samuel
dc.contributor.advisor.none.fl_str_mv	Takahashi Rodríguez, Silvia
dc.contributor.author.none.fl_str_mv	Osorio Algarra, Samuel
dc.subject.keyword.none.fl_str_mv	Inteligencia artificial Deep reinforcement Learning Pacman Dqn
topic	Inteligencia artificial Deep reinforcement Learning Pacman Dqn Ingeniería
dc.subject.themes.es_CO.fl_str_mv	Ingeniería
description	En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento.
publishDate	2022
dc.date.issued.none.fl_str_mv	2022-12-16
dc.date.accessioned.none.fl_str_mv	2023-01-26T20:47:43Z
dc.date.available.none.fl_str_mv	2023-01-26T20:47:43Z
dc.type.es_CO.fl_str_mv	Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv	info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv	http://purl.org/coar/resource_type/c_7a1f
dc.type.content.es_CO.fl_str_mv	Text
dc.type.redcol.none.fl_str_mv	http://purl.org/redcol/resource_type/TP
format	http://purl.org/coar/resource_type/c_7a1f
status_str	acceptedVersion
dc.identifier.uri.none.fl_str_mv	http://hdl.handle.net/1992/64256
dc.identifier.instname.es_CO.fl_str_mv	instname:Universidad de los Andes
dc.identifier.reponame.es_CO.fl_str_mv	reponame:Repositorio Institucional Séneca
dc.identifier.repourl.es_CO.fl_str_mv	repourl:https://repositorio.uniandes.edu.co/
url	http://hdl.handle.net/1992/64256
identifier_str_mv	instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv	spa
language	spa
dc.relation.references.es_CO.fl_str_mv	Khanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8 Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:. Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes. Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv. Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance. Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press. Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292. Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size
dc.rights.license.spa.fl_str_mv	Atribución 4.0 Internacional
dc.rights.uri.*.fl_str_mv	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.spa.fl_str_mv	info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv	http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv	Atribución 4.0 Internacional http://creativecommons.org/licenses/by/4.0/ http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv	openAccess
dc.format.extent.es_CO.fl_str_mv	43 Páginas
dc.format.mimetype.es_CO.fl_str_mv	application/pdf
dc.publisher.es_CO.fl_str_mv	Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv	Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv	Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv	Departamento de Ingeniería Sistemas y Computación
institution	Universidad de los Andes
bitstream.url.fl_str_mv	https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/download https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/download https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download
bitstream.checksum.fl_str_mv	0175ea4a2d4caec4bbcc37e300941108 4f573f72b2d2b2c071f6703c3a316f0b 851e4798a7cf41ed674fe6116e1c820a 08b91b3ffee0748d6a4004c0197d6c31 ea53e16813249ebc5854ff206ac16475 5aa5c691a1ffe97abd12c2966efcb8d6 a5e2c66139ba685a552634341d50a896 4dd99132d5474042584a5290c376665e
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio institucional Séneca
repository.mail.fl_str_mv	adminrepositorio@uniandes.edu.co
_version_	1837004892342845440
spelling	Atribución 4.0 Internacionalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Takahashi Rodríguez, Silviavirtual::928-1Osorio Algarra, Samuel3c24e5cb-26cb-4e58-bcc4-f89762c740a76002023-01-26T20:47:43Z2023-01-26T20:47:43Z2022-12-16http://hdl.handle.net/1992/64256instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En este proyecto de grado se evalúa la efectividad del algoritmo DQN en el juego de Atari Pacman. Estás evaluaciones se hacen en distintos mapas y con un número de distinto de iteraciones de entrenamiento, con el fin de medir la mejora que hay entre el número iteraciones de prueba y el número de iteraciones de entrenamiento.Ingeniero de Sistemas y ComputaciónPregrado43 Páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería Sistemas y ComputaciónUso de deep reinforcement Learning en PacmanTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPInteligencia artificialDeep reinforcement LearningPacmanDqnIngenieríaKhanna, C. (21 de enero de 2021). Independent and Identically Distributed. Obtenido de Towards Data Science: https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8Li, Y. (2017). Deep reinforcement learning: An overview. ArXiv preprint arXiv:.Mantilla, L. C. (2021). Deep Q-Learning. Bogotá: Universidad de los Andes.Puigdomènech, A., Piot, B., Kapturowski, S., Sprechmann, P., Vitvitskyi, A., Guo, D., & Blundell, C. (2020). Agent57: Outperforming the Atari Human Benchmark. arXiv.Purdy, M., & Daugherty, P. (2016). Inteligencia artificial, el futuro del crecimiento. Accenture Institute for High Performance.Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3), 279-292.Wikipedia. (19 de 10 de 2022). Convolutional neural network. Obtenido de Wikipedia: https://en.wikipedia.org/wiki/Convolutional_neural_network#Filter_size201730074Publicationhttps://scholar.google.es/citations?user=x7gjZ04AAAAJvirtual::928-10000-0001-7971-8979virtual::928-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143898virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-17ab9a4e1-60f0-4e06-936b-39f2bf93d8a0virtual::928-1CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/f0ad15d8-d96f-4e57-9a7c-a0875802dace/download0175ea4a2d4caec4bbcc37e300941108MD54ORIGINALTesis.pdfTesis.pdfapplication/pdf748216https://repositorio.uniandes.edu.co/bitstreams/ad665e2d-6a4c-46c7-866d-f46ab3b40406/download4f573f72b2d2b2c071f6703c3a316f0bMD57AutorizacionTesis.pdfAutorizacionTesis.pdfHIDEapplication/pdf221318https://repositorio.uniandes.edu.co/bitstreams/37656d4b-87cd-4e1a-b704-b6edd3250971/download851e4798a7cf41ed674fe6116e1c820aMD56TEXTTesis.pdf.txtTesis.pdf.txtExtracted texttext/plain52171https://repositorio.uniandes.edu.co/bitstreams/cf13dff9-c856-4656-8543-8b8ff472fb45/download08b91b3ffee0748d6a4004c0197d6c31MD58AutorizacionTesis.pdf.txtAutorizacionTesis.pdf.txtExtracted texttext/plain1177https://repositorio.uniandes.edu.co/bitstreams/104dd019-c9aa-4db1-a4e2-a50dc2a59e8e/downloadea53e16813249ebc5854ff206ac16475MD510LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/23a9cce2-642a-4791-858a-00844e3a3102/download5aa5c691a1ffe97abd12c2966efcb8d6MD51THUMBNAILTesis.pdf.jpgTesis.pdf.jpgIM Thumbnailimage/jpeg9281https://repositorio.uniandes.edu.co/bitstreams/02d12324-fe11-4206-b853-dddc6fedfa95/downloada5e2c66139ba685a552634341d50a896MD59AutorizacionTesis.pdf.jpgAutorizacionTesis.pdf.jpgIM Thumbnailimage/jpeg13672https://repositorio.uniandes.edu.co/bitstreams/6ed8cec1-0629-497f-8e3e-9c83a7b44a87/download4dd99132d5474042584a5290c376665eMD5111992/64256oai:repositorio.uniandes.edu.co:1992/642562024-03-13 11:50:35.073http://creativecommons.org/licenses/by/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg==

Uso de deep reinforcement Learning en Pacman

Publicaciones similares