Aprendizaje y optimización de variaciones estratégicas en blackjack mediante aprendizaje por refuerzo en un entorno de simulación realista
Este documento presenta un enfoque integral para optimizar estrategias en Blackjack mediante el uso de Aprendizaje por Refuerzo (RL), resaltando su innovación al incorporar el conteo de cartas a través del True Count en un entorno de simulación realista. La combinación de técnicas avanzadas de RL, c...
- Autores:
-
Cuellar Argotty, Juan Esteban
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2025
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/75506
- Acceso en línea:
- https://hdl.handle.net/1992/75506
- Palabra clave:
- Blackjack
Aprendizaje por refuerzo
Deep Q-Network
Illustrious 18
Hard-nudging
Ingeniería
- Rights
- openAccess
- License
- Attribution-NonCommercial-NoDerivatives 4.0 International