Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía

En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, s...

Full description

Autores:: Rodríguez Quiroga, Juan Esteban

Tipo de recurso:: Trabajo de grado de pregrado

Fecha de publicación:: 2025

Institución:: Universidad de los Andes

Repositorio:: Séneca: repositorio Uniandes

Idioma:: spa

Description
Summary:	En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS.

Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía

Publicaciones similares