Text this: M-Learning: enfoque heurístico para recompensas diferidas en el aprendizaje por refuerzo