Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía

En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, s...

Full description

Autores:
Rodríguez Quiroga, Juan Esteban
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/76261
Acceso en línea:
https://hdl.handle.net/1992/76261
Palabra clave:
Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
Rights
openAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 International
Description
Summary:En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS.