Text this: Aprendizaje por refuerzo para control de sistemas dinámicos