Lenguaje de programación para el aprendizaje por refuerzo

Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzo

Autores:
Ochoa Toro, Andrés Martin
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/64011
Acceso en línea:
http://hdl.handle.net/1992/64011
Palabra clave:
Aprendizaje por refuerzo
Lenguajes de programación
Racket
Ingeniería
Rights
openAccess
License
Atribución 4.0 Internacional
id UNIANDES2_6bb1fb472d6280f6ac202d29ed619242
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/64011
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.none.fl_str_mv Lenguaje de programación para el aprendizaje por refuerzo
title Lenguaje de programación para el aprendizaje por refuerzo
spellingShingle Lenguaje de programación para el aprendizaje por refuerzo
Aprendizaje por refuerzo
Lenguajes de programación
Racket
Ingeniería
title_short Lenguaje de programación para el aprendizaje por refuerzo
title_full Lenguaje de programación para el aprendizaje por refuerzo
title_fullStr Lenguaje de programación para el aprendizaje por refuerzo
title_full_unstemmed Lenguaje de programación para el aprendizaje por refuerzo
title_sort Lenguaje de programación para el aprendizaje por refuerzo
dc.creator.fl_str_mv Ochoa Toro, Andrés Martin
dc.contributor.advisor.none.fl_str_mv Cardozo Álvarez, Nicolás
dc.contributor.author.none.fl_str_mv Ochoa Toro, Andrés Martin
dc.contributor.jury.none.fl_str_mv Cardozo Álvarez, Nicolás
dc.subject.keyword.none.fl_str_mv Aprendizaje por refuerzo
Lenguajes de programación
Racket
topic Aprendizaje por refuerzo
Lenguajes de programación
Racket
Ingeniería
dc.subject.themes.es_CO.fl_str_mv Ingeniería
description Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzo
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-01-19T19:08:38Z
dc.date.available.none.fl_str_mv 2023-01-19T19:08:38Z
dc.date.issued.none.fl_str_mv 2023-01-16
dc.type.es_CO.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.es_CO.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/64011
dc.identifier.instname.es_CO.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.es_CO.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.es_CO.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/64011
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.relation.references.es_CO.fl_str_mv [1] R. S. Sutton, F. Bach, and A. G. Barto, ¿Introduction,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.
[2] ¿Gym is a standard API for reinforcement learning, and a diverse collection of reference environments? Gym Documentation. [Internet]. Disponible en: https://www.gymlibrary.dev/.
[3] R. S. Sutton, F. Bach, and A. G. Barto, ¿Temporal-Difference Learning,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.
[4] M. Butterick, "Beautiful Racket," Beautiful Racket by Matthew Butterick. [Internet]. Disponible en: https://beautifulracket.com/.
[5] P. Ehrlich, "Functional programming paradigms in Reinforcement learning problems," Proyecto de Grado, Fac. Ingeniería, Dpto. Ingeniería de Sistemas y Comp., Prog. Ing Sistemas y Comp. Univ. De los Andes, Bogotá 2022.
[6] JetBrains, ¿What are domain-specific languages (DSL): Mps by jetbrains,? JetBrains. [Internet]. Disponible en: https://www.jetbrains.com/mps/concepts/domain-specific-languages/.
dc.rights.license.spa.fl_str_mv Atribución 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución 4.0 Internacional
http://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 16 páginas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería Sistemas y Computación
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/7cfa4525-b984-499d-bb45-50ec691fb3e2/download
https://repositorio.uniandes.edu.co/bitstreams/bbf5fb80-5e10-4e04-9e70-6868b1f90dc7/download
https://repositorio.uniandes.edu.co/bitstreams/fdb7cb41-dbbd-40c0-890d-5c0d58017a56/download
https://repositorio.uniandes.edu.co/bitstreams/7b397394-1e1d-43ad-8187-f10c1116df2a/download
https://repositorio.uniandes.edu.co/bitstreams/f8741c31-c7ce-471e-80c5-fa43c04f8a0f/download
https://repositorio.uniandes.edu.co/bitstreams/98bb4b33-9543-4f0c-aa30-7a826efd97d4/download
https://repositorio.uniandes.edu.co/bitstreams/04d8f015-40a1-405b-bb28-e280242cb312/download
https://repositorio.uniandes.edu.co/bitstreams/0a8b1901-e197-4a14-afcb-2ce71e3b80cd/download
bitstream.checksum.fl_str_mv ae4c49389e7da91bcb7b21eef7fe8f9c
4fd41c7b1d632b3d57663c9945fa5bc2
0f71e29248a1ed31da1aab5c9191ea75
4491fe1afb58beaaef41a73cf7ff2e27
858e7b5287a0a35a9509a9537ee2887b
a4c5d775f8cdb3bb910db925f4ed551d
0175ea4a2d4caec4bbcc37e300941108
5aa5c691a1ffe97abd12c2966efcb8d6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133871857172480
spelling Atribución 4.0 Internacionalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Cardozo Álvarez, Nicolásvirtual::4756-1Ochoa Toro, Andrés Martince60d766-388e-4f41-9773-86449f1fbb6b600Cardozo Álvarez, Nicolás2023-01-19T19:08:38Z2023-01-19T19:08:38Z2023-01-16http://hdl.handle.net/1992/64011instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzoEl auge de la inteligencia artificial está empezando a encontrar sus límites. Una de las razones de estos límites proviene de la falta de modelos de programación adecuados para representar y expresar los conceptos de los algoritmos de aprendizaje. Un ejemplo de ello son los programas de aprendizaje por refuerzo (Reinforcement Learning), que a menudo carecen de los estándares y la calidad de los proyectos de software habituales. Este problema surge, en parte, de la escasez de herramientas para expresar y representar los programas construidos con técnicas de aprendizaje por refuerzo. Para contrarrestar estos problemas, queremos diseñar e implementar abstracciones de nivel de lenguaje apropiadas para el aprendizaje por refuerzo. El objetivo final de este desarrollo es ofrecer a los desarrolladores mejores herramientas y abstracciones para expresar y representar algoritmos y técnicas dentro de un programa. Esto incluye la abstracción del espacio de estados y acciones, la representación de la técnica de aprendizaje y sus (hiper)parámetros de tal manera que los programadores puedan centrarse en la complejidad intrínseca de los programas, en lugar de en los detalles específicos del aprendizaje por refuerzo.Ingeniero de Sistemas y ComputaciónPregrado16 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería Sistemas y ComputaciónLenguaje de programación para el aprendizaje por refuerzoTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzoLenguajes de programaciónRacketIngeniería[1] R. S. Sutton, F. Bach, and A. G. Barto, ¿Introduction,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.[2] ¿Gym is a standard API for reinforcement learning, and a diverse collection of reference environments? Gym Documentation. [Internet]. Disponible en: https://www.gymlibrary.dev/.[3] R. S. Sutton, F. Bach, and A. G. Barto, ¿Temporal-Difference Learning,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.[4] M. Butterick, "Beautiful Racket," Beautiful Racket by Matthew Butterick. [Internet]. Disponible en: https://beautifulracket.com/.[5] P. Ehrlich, "Functional programming paradigms in Reinforcement learning problems," Proyecto de Grado, Fac. Ingeniería, Dpto. Ingeniería de Sistemas y Comp., Prog. Ing Sistemas y Comp. Univ. De los Andes, Bogotá 2022.[6] JetBrains, ¿What are domain-specific languages (DSL): Mps by jetbrains,? JetBrains. [Internet]. Disponible en: https://www.jetbrains.com/mps/concepts/domain-specific-languages/.201913554Publicationhttps://scholar.google.es/citations?user=3iTzjQsAAAAJvirtual::4756-10000-0002-1094-9952virtual::4756-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::4756-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::4756-1ORIGINALLenguaje de programación para el aprendizaje por refuerzo.pdfLenguaje de programación para el aprendizaje por refuerzo.pdfTrabajo de gradoapplication/pdf344912https://repositorio.uniandes.edu.co/bitstreams/7cfa4525-b984-499d-bb45-50ec691fb3e2/downloadae4c49389e7da91bcb7b21eef7fe8f9cMD53FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdfFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdfHIDEapplication/pdf201209https://repositorio.uniandes.edu.co/bitstreams/bbf5fb80-5e10-4e04-9e70-6868b1f90dc7/download4fd41c7b1d632b3d57663c9945fa5bc2MD54TEXTLenguaje de programación para el aprendizaje por refuerzo.pdf.txtLenguaje de programación para el aprendizaje por refuerzo.pdf.txtExtracted texttext/plain28314https://repositorio.uniandes.edu.co/bitstreams/fdb7cb41-dbbd-40c0-890d-5c0d58017a56/download0f71e29248a1ed31da1aab5c9191ea75MD55FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.txtFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.txtExtracted texttext/plain1163https://repositorio.uniandes.edu.co/bitstreams/7b397394-1e1d-43ad-8187-f10c1116df2a/download4491fe1afb58beaaef41a73cf7ff2e27MD57THUMBNAILLenguaje de programación para el aprendizaje por refuerzo.pdf.jpgLenguaje de programación para el aprendizaje por refuerzo.pdf.jpgIM Thumbnailimage/jpeg1863https://repositorio.uniandes.edu.co/bitstreams/f8741c31-c7ce-471e-80c5-fa43c04f8a0f/download858e7b5287a0a35a9509a9537ee2887bMD56FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.jpgFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.jpgIM Thumbnailimage/jpeg15982https://repositorio.uniandes.edu.co/bitstreams/98bb4b33-9543-4f0c-aa30-7a826efd97d4/downloada4c5d775f8cdb3bb910db925f4ed551dMD58CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/04d8f015-40a1-405b-bb28-e280242cb312/download0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/0a8b1901-e197-4a14-afcb-2ce71e3b80cd/download5aa5c691a1ffe97abd12c2966efcb8d6MD511992/64011oai:repositorio.uniandes.edu.co:1992/640112024-03-13 12:46:00.269http://creativecommons.org/licenses/by/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg==