Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, s...
- Autores:
-
Rodríguez Quiroga, Juan Esteban
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2025
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/76261
- Acceso en línea:
- https://hdl.handle.net/1992/76261
- Palabra clave:
- Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
- Rights
- openAccess
- License
- Attribution-NonCommercial-NoDerivatives 4.0 International
id |
UNIANDES2_5da7d33d0c3741ecb5bfc842b0d5b43a |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/76261 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
title |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
spellingShingle |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía Aprendizaje por refuerzo Sistemas de manejo de energía Ingeniería |
title_short |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
title_full |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
title_fullStr |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
title_full_unstemmed |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
title_sort |
Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía |
dc.creator.fl_str_mv |
Rodríguez Quiroga, Juan Esteban |
dc.contributor.advisor.none.fl_str_mv |
Lozano Martínez, Fernando Enrique |
dc.contributor.author.none.fl_str_mv |
Rodríguez Quiroga, Juan Esteban |
dc.contributor.jury.none.fl_str_mv |
Osma Cruz, Johann Faccelo |
dc.subject.keyword.spa.fl_str_mv |
Aprendizaje por refuerzo |
topic |
Aprendizaje por refuerzo Sistemas de manejo de energía Ingeniería |
dc.subject.keyword.none.fl_str_mv |
Sistemas de manejo de energía |
dc.subject.themes.spa.fl_str_mv |
Ingeniería |
description |
En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS. |
publishDate |
2025 |
dc.date.accessioned.none.fl_str_mv |
2025-06-10T14:43:01Z |
dc.date.available.none.fl_str_mv |
2025-06-10T14:43:01Z |
dc.date.issued.none.fl_str_mv |
2025-06-04 |
dc.type.none.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.none.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/1992/76261 |
dc.identifier.instname.none.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.none.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
https://hdl.handle.net/1992/76261 |
identifier_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.en.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
13 páginas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Ingeniería Electrónica |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería Eléctrica y Electrónica |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/7fc31247-1bd1-4238-8463-2825aa58dc2e/download https://repositorio.uniandes.edu.co/bitstreams/91f48468-bd34-447d-a37f-da65806567e5/download https://repositorio.uniandes.edu.co/bitstreams/50249306-88ed-489a-89c9-6d779c0fc572/download https://repositorio.uniandes.edu.co/bitstreams/589420b3-2c19-469d-b97c-72d05de770bb/download https://repositorio.uniandes.edu.co/bitstreams/cb6eea75-82f0-495a-a487-702d8cc33ef6/download https://repositorio.uniandes.edu.co/bitstreams/cdd3e368-270c-402c-9eef-44460022b692/download https://repositorio.uniandes.edu.co/bitstreams/82d36b38-ac25-41c2-9ab5-06f3b037c3d8/download https://repositorio.uniandes.edu.co/bitstreams/fd162a22-d447-4f33-98d6-04ed6dff61b3/download |
bitstream.checksum.fl_str_mv |
eb3e9ede0eddb20561a0cef6ed541da4 cb3bd5de8191691004d7c6d4b8def2d4 4460e5956bc1d1639be9ae6146a50347 ae9e573a68e7f92501b6913cc846c39f b0090c0893dfcc4b86afd4edbaaf7c90 f080dd4ea02226bbe90721a3a199fea0 fa4d28e979034092ec05754fdb378ad4 1bebc80f6e440c65045c6beed085af30 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1837005479825375232 |
spelling |
Lozano Martínez, Fernando Enriquevirtual::24170-1Rodríguez Quiroga, Juan EstebanOsma Cruz, Johann Faccelo2025-06-10T14:43:01Z2025-06-10T14:43:01Z2025-06-04https://hdl.handle.net/1992/76261instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS.Pregrado13 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energíaTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzoSistemas de manejo de energíaIngeniería202121539Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::24170-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::24170-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::24170-1ORIGINALEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdfEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdfapplication/pdf1183703https://repositorio.uniandes.edu.co/bitstreams/7fc31247-1bd1-4238-8463-2825aa58dc2e/downloadeb3e9ede0eddb20561a0cef6ed541da4MD51FormatoEntregaDocumento - Electrónica copy.pdfFormatoEntregaDocumento - Electrónica copy.pdfHIDEapplication/pdf292329https://repositorio.uniandes.edu.co/bitstreams/91f48468-bd34-447d-a37f-da65806567e5/downloadcb3bd5de8191691004d7c6d4b8def2d4MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.uniandes.edu.co/bitstreams/50249306-88ed-489a-89c9-6d779c0fc572/download4460e5956bc1d1639be9ae6146a50347MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/589420b3-2c19-469d-b97c-72d05de770bb/downloadae9e573a68e7f92501b6913cc846c39fMD54TEXTEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.txtEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.txtExtracted texttext/plain64255https://repositorio.uniandes.edu.co/bitstreams/cb6eea75-82f0-495a-a487-702d8cc33ef6/downloadb0090c0893dfcc4b86afd4edbaaf7c90MD55FormatoEntregaDocumento - Electrónica copy.pdf.txtFormatoEntregaDocumento - Electrónica copy.pdf.txtExtracted texttext/plain2085https://repositorio.uniandes.edu.co/bitstreams/cdd3e368-270c-402c-9eef-44460022b692/downloadf080dd4ea02226bbe90721a3a199fea0MD57THUMBNAILEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.jpgEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.jpgIM Thumbnailimage/jpeg29113https://repositorio.uniandes.edu.co/bitstreams/82d36b38-ac25-41c2-9ab5-06f3b037c3d8/downloadfa4d28e979034092ec05754fdb378ad4MD56FormatoEntregaDocumento - Electrónica copy.pdf.jpgFormatoEntregaDocumento - Electrónica copy.pdf.jpgIM Thumbnailimage/jpeg16730https://repositorio.uniandes.edu.co/bitstreams/fd162a22-d447-4f33-98d6-04ed6dff61b3/download1bebc80f6e440c65045c6beed085af30MD581992/76261oai:repositorio.uniandes.edu.co:1992/762612025-06-11 04:09:59.379http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K |