Evaluación de un método de aprendizaje por refuerzo para problemas de recompensas con costos en sistemas de manejo de energía
En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, s...
- Autores:
-
Rodríguez Quiroga, Juan Esteban
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2025
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/76261
- Acceso en línea:
- https://hdl.handle.net/1992/76261
- Palabra clave:
- Aprendizaje por refuerzo
Sistemas de manejo de energía
Ingeniería
- Rights
- openAccess
- License
- Attribution-NonCommercial-NoDerivatives 4.0 International
Summary: | En el siguiente documento se presenta una solución para los sistemas de manejo de energía (EMS) como un problema de recompensas con costos. Estos sistemas se tratan en el contexto de aprendizaje por refuerzo como un problema de recompensa acumulada, pero su naturaleza incluye costos. Por lo tanto, se hace uso del algoritmo de nudging y la idea detras del algoritmo de Constant Shifting Values (CSV), en los que se utilizan algoritmos de aprendizaje por refuerzo profundo para hallar políticas que maximicen la relacion entre las recompensas y los costos de tomar acciones (ρ) en EMS. Así mismo, se estudia este problema de alta complejidad con estados y acciones continuas, a la vez que se estudia el efecto de discretizar las acciones. Por medio de diferentes casos de estudio, se obtienen diferentes agentes con los que se extraen resultados de su rendimiento los cuales permiten concluir acerca del funcionamiento, tiempo de entrenamiento y la viabilidad de los algoritmos de recompensas con costo en EMS. |
---|