Aprendizaje reforzado en pair-trading Aplicación para una estrategia pair-trading
Este estudio explora las implicaciones de la implementación de técnicas de aprendizaje reforzado para el trading de acciones parte del índice S&P 500 al 15 de octubre de 2022, bajo una estrategia de pair-trading. A través de un proceso de selección de pares de acciones se investiga si m...
- Autores:
-
Quintero González , Cristian
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2024
- Institución:
- Universidad Externado de Colombia
- Repositorio:
- Biblioteca Digital Universidad Externado de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:bdigital.uexternado.edu.co:001/25300
- Acceso en línea:
- https://bdigital.uexternado.edu.co/handle/001/25300
https://doi.org/10.18601/17941113.n26.04
- Palabra clave:
- Reinforcement learning;
trading;
statistical arbitrage;
pair-trading
aprendizaje reforzado;
arbitraje estadístico;
pair-trading;
trading
- Rights
- openAccess
- License
- Cristian Quintero González - 2024
Summary: | Este estudio explora las implicaciones de la implementación de técnicas de aprendizaje reforzado para el trading de acciones parte del índice S&P 500 al 15 de octubre de 2022, bajo una estrategia de pair-trading. A través de un proceso de selección de pares de acciones se investiga si modelos de aprendizaje reforzado ofrecen una ventaja frente estrategias más simples. Los resultados indicaron sorpresivamente que modelos entrenados con entornos sencillos como el que no permite posiciones en corto, producen una mayor y constante rentabilidad, si se compara con los agentes entrenados en entornos con mayor complejidad lógica como lo son el de proporción del saldo disponible para entrar en posiciones según el conjunto de acciones y β-balanceado. Adicionalmente se observó que un incremento en el número de pasos por episodio, que generalmente lleva a consumir un mayor tiempo de entrenamiento para el hardware usado, no es garantía de mejorar considerablemente la varianza de la distribución de rentabilidades potenciales en los datos de trading, como tampoco es una variable que permita mejorar significativamente la media del retorno u otros indicadores, lo que se evidencia también en los valores value loss y policy loss, los cuales se tornaban explosivos y más volátiles luego de un valor de episodios determinado. |
---|