Text this: Implementación de un agente capaz de aprender las acciones óptimas de un ascensor utilizando aprendizaje por refuerzo