Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía

En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, s...

Full description

Autores:
Rodríguez Quiroga, Juan Esteban
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/76261
Acceso en línea:
https://hdl.handle.net/1992/76261
Palabra clave:
Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
Rights
openAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 International
id UNIANDES2_5da7d33d0c3741ecb5bfc842b0d5b43a
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/76261
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
title Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
spellingShingle Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
title_short Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
title_full Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
title_fullStr Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
title_full_unstemmed Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
title_sort Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
dc.creator.fl_str_mv Rodríguez Quiroga, Juan Esteban
dc.contributor.advisor.none.fl_str_mv Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Rodríguez Quiroga, Juan Esteban
dc.contributor.jury.none.fl_str_mv Osma Cruz, Johann Faccelo
dc.subject.keyword.spa.fl_str_mv Aprendizaje por refuerzo
topic Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
dc.subject.keyword.none.fl_str_mv Sistemas de manejo de energía
dc.subject.themes.spa.fl_str_mv Ingeniería
description En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-06-10T14:43:01Z
dc.date.available.none.fl_str_mv 2025-06-10T14:43:01Z
dc.date.issued.none.fl_str_mv 2025-06-04
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/76261
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/76261
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.en.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 13 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/7fc31247-1bd1-4238-8463-2825aa58dc2e/download
https://repositorio.uniandes.edu.co/bitstreams/91f48468-bd34-447d-a37f-da65806567e5/download
https://repositorio.uniandes.edu.co/bitstreams/50249306-88ed-489a-89c9-6d779c0fc572/download
https://repositorio.uniandes.edu.co/bitstreams/589420b3-2c19-469d-b97c-72d05de770bb/download
https://repositorio.uniandes.edu.co/bitstreams/cb6eea75-82f0-495a-a487-702d8cc33ef6/download
https://repositorio.uniandes.edu.co/bitstreams/cdd3e368-270c-402c-9eef-44460022b692/download
https://repositorio.uniandes.edu.co/bitstreams/82d36b38-ac25-41c2-9ab5-06f3b037c3d8/download
https://repositorio.uniandes.edu.co/bitstreams/fd162a22-d447-4f33-98d6-04ed6dff61b3/download
bitstream.checksum.fl_str_mv eb3e9ede0eddb20561a0cef6ed541da4
cb3bd5de8191691004d7c6d4b8def2d4
4460e5956bc1d1639be9ae6146a50347
ae9e573a68e7f92501b6913cc846c39f
b0090c0893dfcc4b86afd4edbaaf7c90
f080dd4ea02226bbe90721a3a199fea0
fa4d28e979034092ec05754fdb378ad4
1bebc80f6e440c65045c6beed085af30
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1837005479825375232
spelling Lozano Martínez, Fernando Enriquevirtual::24170-1Rodríguez Quiroga, Juan EstebanOsma Cruz, Johann Faccelo2025-06-10T14:43:01Z2025-06-10T14:43:01Z2025-06-04https://hdl.handle.net/1992/76261instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS.Pregrado13 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y ElectrónicaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energíaTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPAprendizaje por refuerzoSistemas de manejo de energíaIngeniería202121539Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::24170-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::24170-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::24170-1ORIGINALEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdfEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdfapplication/pdf1183703https://repositorio.uniandes.edu.co/bitstreams/7fc31247-1bd1-4238-8463-2825aa58dc2e/downloadeb3e9ede0eddb20561a0cef6ed541da4MD51FormatoEntregaDocumento - Electrónica copy.pdfFormatoEntregaDocumento - Electrónica copy.pdfHIDEapplication/pdf292329https://repositorio.uniandes.edu.co/bitstreams/91f48468-bd34-447d-a37f-da65806567e5/downloadcb3bd5de8191691004d7c6d4b8def2d4MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.uniandes.edu.co/bitstreams/50249306-88ed-489a-89c9-6d779c0fc572/download4460e5956bc1d1639be9ae6146a50347MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/589420b3-2c19-469d-b97c-72d05de770bb/downloadae9e573a68e7f92501b6913cc846c39fMD54TEXTEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.txtEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.txtExtracted texttext/plain64255https://repositorio.uniandes.edu.co/bitstreams/cb6eea75-82f0-495a-a487-702d8cc33ef6/downloadb0090c0893dfcc4b86afd4edbaaf7c90MD55FormatoEntregaDocumento - Electrónica copy.pdf.txtFormatoEntregaDocumento - Electrónica copy.pdf.txtExtracted texttext/plain2085https://repositorio.uniandes.edu.co/bitstreams/cdd3e368-270c-402c-9eef-44460022b692/downloadf080dd4ea02226bbe90721a3a199fea0MD57THUMBNAILEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.jpgEvaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía.pdf.jpgIM Thumbnailimage/jpeg29113https://repositorio.uniandes.edu.co/bitstreams/82d36b38-ac25-41c2-9ab5-06f3b037c3d8/downloadfa4d28e979034092ec05754fdb378ad4MD56FormatoEntregaDocumento - Electrónica copy.pdf.jpgFormatoEntregaDocumento - Electrónica copy.pdf.jpgIM Thumbnailimage/jpeg16730https://repositorio.uniandes.edu.co/bitstreams/fd162a22-d447-4f33-98d6-04ed6dff61b3/download1bebc80f6e440c65045c6beed085af30MD581992/76261oai:repositorio.uniandes.edu.co:1992/762612025-06-11 04:09:59.379http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K