Lenguaje de programación para el aprendizaje por refuerzo
Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzo
- Autores:
-
Ochoa Toro, Andrés Martin
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/64011
- Acceso en línea:
- http://hdl.handle.net/1992/64011
- Palabra clave:
- Aprendizaje por refuerzo
Lenguajes de programación
Racket
Ingeniería
- Rights
- openAccess
- License
- Atribución 4.0 Internacional
id |
UNIANDES2_6bb1fb472d6280f6ac202d29ed619242 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/64011 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.none.fl_str_mv |
Lenguaje de programación para el aprendizaje por refuerzo |
title |
Lenguaje de programación para el aprendizaje por refuerzo |
spellingShingle |
Lenguaje de programación para el aprendizaje por refuerzo Aprendizaje por refuerzo Lenguajes de programación Racket Ingeniería |
title_short |
Lenguaje de programación para el aprendizaje por refuerzo |
title_full |
Lenguaje de programación para el aprendizaje por refuerzo |
title_fullStr |
Lenguaje de programación para el aprendizaje por refuerzo |
title_full_unstemmed |
Lenguaje de programación para el aprendizaje por refuerzo |
title_sort |
Lenguaje de programación para el aprendizaje por refuerzo |
dc.creator.fl_str_mv |
Ochoa Toro, Andrés Martin |
dc.contributor.advisor.none.fl_str_mv |
Cardozo Álvarez, Nicolás |
dc.contributor.author.none.fl_str_mv |
Ochoa Toro, Andrés Martin |
dc.contributor.jury.none.fl_str_mv |
Cardozo Álvarez, Nicolás |
dc.subject.keyword.none.fl_str_mv |
Aprendizaje por refuerzo Lenguajes de programación Racket |
topic |
Aprendizaje por refuerzo Lenguajes de programación Racket Ingeniería |
dc.subject.themes.es_CO.fl_str_mv |
Ingeniería |
description |
Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzo |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2023-01-19T19:08:38Z |
dc.date.available.none.fl_str_mv |
2023-01-19T19:08:38Z |
dc.date.issued.none.fl_str_mv |
2023-01-16 |
dc.type.es_CO.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.es_CO.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/64011 |
dc.identifier.instname.es_CO.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.es_CO.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.es_CO.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/64011 |
identifier_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.relation.references.es_CO.fl_str_mv |
[1] R. S. Sutton, F. Bach, and A. G. Barto, ¿Introduction,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018. [2] ¿Gym is a standard API for reinforcement learning, and a diverse collection of reference environments? Gym Documentation. [Internet]. Disponible en: https://www.gymlibrary.dev/. [3] R. S. Sutton, F. Bach, and A. G. Barto, ¿Temporal-Difference Learning,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018. [4] M. Butterick, "Beautiful Racket," Beautiful Racket by Matthew Butterick. [Internet]. Disponible en: https://beautifulracket.com/. [5] P. Ehrlich, "Functional programming paradigms in Reinforcement learning problems," Proyecto de Grado, Fac. Ingeniería, Dpto. Ingeniería de Sistemas y Comp., Prog. Ing Sistemas y Comp. Univ. De los Andes, Bogotá 2022. [6] JetBrains, ¿What are domain-specific languages (DSL): Mps by jetbrains,? JetBrains. [Internet]. Disponible en: https://www.jetbrains.com/mps/concepts/domain-specific-languages/. |
dc.rights.license.spa.fl_str_mv |
Atribución 4.0 Internacional |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución 4.0 Internacional http://creativecommons.org/licenses/by/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
16 páginas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería Sistemas y Computación |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/7cfa4525-b984-499d-bb45-50ec691fb3e2/download https://repositorio.uniandes.edu.co/bitstreams/bbf5fb80-5e10-4e04-9e70-6868b1f90dc7/download https://repositorio.uniandes.edu.co/bitstreams/fdb7cb41-dbbd-40c0-890d-5c0d58017a56/download https://repositorio.uniandes.edu.co/bitstreams/7b397394-1e1d-43ad-8187-f10c1116df2a/download https://repositorio.uniandes.edu.co/bitstreams/f8741c31-c7ce-471e-80c5-fa43c04f8a0f/download https://repositorio.uniandes.edu.co/bitstreams/98bb4b33-9543-4f0c-aa30-7a826efd97d4/download https://repositorio.uniandes.edu.co/bitstreams/04d8f015-40a1-405b-bb28-e280242cb312/download https://repositorio.uniandes.edu.co/bitstreams/0a8b1901-e197-4a14-afcb-2ce71e3b80cd/download |
bitstream.checksum.fl_str_mv |
ae4c49389e7da91bcb7b21eef7fe8f9c 4fd41c7b1d632b3d57663c9945fa5bc2 0f71e29248a1ed31da1aab5c9191ea75 4491fe1afb58beaaef41a73cf7ff2e27 858e7b5287a0a35a9509a9537ee2887b a4c5d775f8cdb3bb910db925f4ed551d 0175ea4a2d4caec4bbcc37e300941108 5aa5c691a1ffe97abd12c2966efcb8d6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133871857172480 |
spelling |
Atribución 4.0 Internacionalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Cardozo Álvarez, Nicolásvirtual::4756-1Ochoa Toro, Andrés Martince60d766-388e-4f41-9773-86449f1fbb6b600Cardozo Álvarez, Nicolás2023-01-19T19:08:38Z2023-01-19T19:08:38Z2023-01-16http://hdl.handle.net/1992/64011instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este documento hace una aproximación de la implementación de un lenguaje de programación de dominio específico para problemas de aprendizaje por refuerzoEl auge de la inteligencia artificial está empezando a encontrar sus límites. Una de las razones de estos límites proviene de la falta de modelos de programación adecuados para representar y expresar los conceptos de los algoritmos de aprendizaje. Un ejemplo de ello son los programas de aprendizaje por refuerzo (Reinforcement Learning), que a menudo carecen de los estándares y la calidad de los proyectos de software habituales. Este problema surge, en parte, de la escasez de herramientas para expresar y representar los programas construidos con técnicas de aprendizaje por refuerzo. Para contrarrestar estos problemas, queremos diseñar e implementar abstracciones de nivel de lenguaje apropiadas para el aprendizaje por refuerzo. El objetivo final de este desarrollo es ofrecer a los desarrolladores mejores herramientas y abstracciones para expresar y representar algoritmos y técnicas dentro de un programa. Esto incluye la abstracción del espacio de estados y acciones, la representación de la técnica de aprendizaje y sus (hiper)parámetros de tal manera que los programadores puedan centrarse en la complejidad intrínseca de los programas, en lugar de en los detalles específicos del aprendizaje por refuerzo.Ingeniero de Sistemas y ComputaciónPregrado16 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería Sistemas y ComputaciónLenguaje de programación para el aprendizaje por refuerzoTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzoLenguajes de programaciónRacketIngeniería[1] R. S. Sutton, F. Bach, and A. G. Barto, ¿Introduction,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.[2] ¿Gym is a standard API for reinforcement learning, and a diverse collection of reference environments? Gym Documentation. [Internet]. Disponible en: https://www.gymlibrary.dev/.[3] R. S. Sutton, F. Bach, and A. G. Barto, ¿Temporal-Difference Learning,¿ en Reinforcement learning: An introduction, Massachusetts: MIT Press Ltd, 2018.[4] M. Butterick, "Beautiful Racket," Beautiful Racket by Matthew Butterick. [Internet]. Disponible en: https://beautifulracket.com/.[5] P. Ehrlich, "Functional programming paradigms in Reinforcement learning problems," Proyecto de Grado, Fac. Ingeniería, Dpto. Ingeniería de Sistemas y Comp., Prog. Ing Sistemas y Comp. Univ. De los Andes, Bogotá 2022.[6] JetBrains, ¿What are domain-specific languages (DSL): Mps by jetbrains,? JetBrains. [Internet]. Disponible en: https://www.jetbrains.com/mps/concepts/domain-specific-languages/.201913554Publicationhttps://scholar.google.es/citations?user=3iTzjQsAAAAJvirtual::4756-10000-0002-1094-9952virtual::4756-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::4756-1a77ff528-fc33-44d6-9022-814f81ef407avirtual::4756-1ORIGINALLenguaje de programación para el aprendizaje por refuerzo.pdfLenguaje de programación para el aprendizaje por refuerzo.pdfTrabajo de gradoapplication/pdf344912https://repositorio.uniandes.edu.co/bitstreams/7cfa4525-b984-499d-bb45-50ec691fb3e2/downloadae4c49389e7da91bcb7b21eef7fe8f9cMD53FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdfFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdfHIDEapplication/pdf201209https://repositorio.uniandes.edu.co/bitstreams/bbf5fb80-5e10-4e04-9e70-6868b1f90dc7/download4fd41c7b1d632b3d57663c9945fa5bc2MD54TEXTLenguaje de programación para el aprendizaje por refuerzo.pdf.txtLenguaje de programación para el aprendizaje por refuerzo.pdf.txtExtracted texttext/plain28314https://repositorio.uniandes.edu.co/bitstreams/fdb7cb41-dbbd-40c0-890d-5c0d58017a56/download0f71e29248a1ed31da1aab5c9191ea75MD55FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.txtFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.txtExtracted texttext/plain1163https://repositorio.uniandes.edu.co/bitstreams/7b397394-1e1d-43ad-8187-f10c1116df2a/download4491fe1afb58beaaef41a73cf7ff2e27MD57THUMBNAILLenguaje de programación para el aprendizaje por refuerzo.pdf.jpgLenguaje de programación para el aprendizaje por refuerzo.pdf.jpgIM Thumbnailimage/jpeg1863https://repositorio.uniandes.edu.co/bitstreams/f8741c31-c7ce-471e-80c5-fa43c04f8a0f/download858e7b5287a0a35a9509a9537ee2887bMD56FORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.jpgFORMATO DE AUTORIZACIÓN Y ENTREGA DE TESISTRABAJO DE GRADO .pdf.jpgIM Thumbnailimage/jpeg15982https://repositorio.uniandes.edu.co/bitstreams/98bb4b33-9543-4f0c-aa30-7a826efd97d4/downloada4c5d775f8cdb3bb910db925f4ed551dMD58CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/04d8f015-40a1-405b-bb28-e280242cb312/download0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/0a8b1901-e197-4a14-afcb-2ce71e3b80cd/download5aa5c691a1ffe97abd12c2966efcb8d6MD511992/64011oai:repositorio.uniandes.edu.co:1992/640112024-03-13 12:46:00.269http://creativecommons.org/licenses/by/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg== |