Aprendizaje por refuerzo para control de sistemas dinámicos
El aprendizaje por refuerzo o RL – Reinforcement Learning, por sus siglas en inglés, es una rama de la inteligencia artificial que trata sobre un agente que recibe información de un entorno o ambiente en forma de estados y acciones, además de que actúa en el entorno, lo que resulta en un nuevo estad...
- Autores:
-
Díaz Latorre, Andrés Steven
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad Autónoma de Occidente
- Repositorio:
- RED: Repositorio Educativo Digital UAO
- Idioma:
- spa
- OAI Identifier:
- oai:red.uao.edu.co:10614/11694
- Acceso en línea:
- http://red.uao.edu.co//handle/10614/11694
- Palabra clave:
- Ingenería Mecatrónica
Algoritmos (Computadores)
Aprendizaje automático (Inteligencia artificial)
Reinforcement learning
Computer algorithms
Machine learning
- Rights
- openAccess
- License
- Derechos Reservados - Universidad Autónoma de Occidente
Summary: | El aprendizaje por refuerzo o RL – Reinforcement Learning, por sus siglas en inglés, es una rama de la inteligencia artificial que trata sobre un agente que recibe información de un entorno o ambiente en forma de estados y acciones, además de que actúa en el entorno, lo que resulta en un nuevo estado, el agente recibe una recompensa como pago al tomar una acción. Esta recompensa se le asigna al nuevo estado, por lo cual, a medida que el agente tome acciones la recompensa tendrá un valor tanto positivo como negativo. En el proyecto se desarrolló una serie de algoritmos en lenguaje Python para el control de sistemas dinámicos clásicos, utilizando las librerías Gym y Tensorflow. Se utilizó Python porque es uno de los lenguajes de programación más utilizados al ser de código abierto, orientado a objetos y por la facilidad de instalación de paquetes. Los métodos de aprendizaje que se utilizaron en los algoritmos están basados en Q-Learning, Deep Q-Learning y actor – crítico, más conocido como A2C. Además se presenta a modo de guía y con fines educativos el proceso paso a paso para la creación de entornos propios con la librería de Gym además de cómo implementar estos algoritmos en nuestros propios entornos dado a que gran parte de esta temática se encuentra disponible en inglés, incluso en algunas universidades el RL lo suelen resumir con Q-Learning, pero esta rama de inteligencia es más grande |
---|