M-Learning: enfoque heurístico para recompensas diferidas en el aprendizaje por refuerzo

El diseño actual de los métodos de aprendizaje por refuerzo requiere grandes recursos computacionales. Algoritmos como Deep Q-Network (DQN) han obtenido resultados sobresalientes en el avance de este campo. Sin embargo, la necesidad de ajustar miles de parámetros y ejecutar millones de episodios de...

Full description

Autores:
Mora Cortés, Marlon Sneider
Perdomo Charry , César Andrey
Perdomo Charry , Oscar Julián
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/93453
Acceso en línea:
http://hdl.handle.net/11349/93453
Palabra clave:
Aprendizaje por refuerzo
Dilema exploración-explotación
Q-Learning
Frozen lake
Enfoque heurístico
Ingeniería Electrónica -- Tesis y Disertaciones Académicas
Minería de datos
Aprendizaje por experiencia
Aprendizaje por descubrimiento
Reinforcement learning
Exploration-exploitation dilemma
Q-Learning
Frozen Lake
Heuristic approach
Rights
License
Abierto (Texto Completo)