Aprendizaje reforzado en pair-trading Aplicación para una estrategia pair-trading

Este estudio explora las implicaciones de la implementación de técnicas de apren­dizaje reforzado para el trading de acciones parte del índice S&P 500 al 15 de octubre de 2022, bajo una estrategia de pair-trading. A través de un proceso de selección de pares de acciones se investiga si m...

Full description

Autores:
Quintero González , Cristian
Tipo de recurso:
Article of journal
Fecha de publicación:
2024
Institución:
Universidad Externado de Colombia
Repositorio:
Biblioteca Digital Universidad Externado de Colombia
Idioma:
spa
OAI Identifier:
oai:bdigital.uexternado.edu.co:001/25300
Acceso en línea:
https://bdigital.uexternado.edu.co/handle/001/25300
https://doi.org/10.18601/17941113.n26.04
Palabra clave:
Reinforcement learning;
trading;
statistical arbitrage;
pair-trading
aprendizaje reforzado;
arbitraje estadístico;
pair-trading;
trading
Rights
openAccess
License
Cristian Quintero González - 2024
Description
Summary:Este estudio explora las implicaciones de la implementación de técnicas de apren­dizaje reforzado para el trading de acciones parte del índice S&P 500 al 15 de octubre de 2022, bajo una estrategia de pair-trading. A través de un proceso de selección de pares de acciones se investiga si modelos de aprendizaje reforzado ofrecen una ventaja frente estrategias más simples. Los resultados indicaron sorpresivamente que modelos entrenados con entornos sencillos como el que no permite posiciones en corto, producen una mayor y constante rentabilidad, si se compara con los agentes entrenados en entornos con mayor complejidad lógica como lo son el de proporción del saldo disponible para entrar en posiciones según el conjunto de acciones y β-balanceado. Adicionalmente se observó que un incremento en el número de pasos por episodio, que generalmente lleva a con­sumir un mayor tiempo de entrenamiento para el hardware usado, no es garantía de mejorar considerablemente la varianza de la distribución de rentabilidades potenciales en los datos de trading, como tampoco es una variable que permita mejorar significativamente la media del retorno u otros indicadores, lo que se evidencia también en los valores value loss y policy loss, los cuales se tornaban explosivos y más volátiles luego de un valor de episodios determinado.