¿El aprendizaje por refuerzo se usa popularmente en la optimización de ejecución comercial?

Realmente no.

Así es como la mayoría de las empresas abordan los algoritmos de ejecución. Cuando llega un pedido para decir comprar 100,000 acciones de una acción, generalmente se realiza asumiendo que la orden tendrá un implante mínimo en el precio de la acción. Dependiendo de cómo se ejecute, la orden tendrá un efecto a corto y largo plazo. La mayor parte de la literatura establecida sobre la ejecución de órdenes cuantifica el pacto temporal de la orden sobre el precio en función del tamaño negociado dividido por el volumen total del mercado en ese período. Dado que estamos tratando de tener un impacto mínimo en el precio, especialmente un “impacto temporal” mínimo, nos gustaría que la proporción del tamaño de la orden por volumen de mercado sea menor.

Es por eso que sin hacer nada, VWAP es el mejor algoritmo que uno puede usar para ejecutar y ordenar. Literalmente se traduce en romper el orden en pequeños trozos, de modo que cada cinco minutos estamos negociando un tamaño que es proporcional al volumen de mercado que se negoció en esos cinco minutos.

Lo que podemos hacer por encima de VWAP es agregar una fuente de alfa.

Si revisa una empresa comercial sistemática como la cartera insignia de qplum, una parte de su alfa proviene de alpha-VWAP. Es alrededor del 0.15%, creo.

¡Creo que a lo que te refieres es una idea genial! Estoy bastante seguro de que la gente aún no lo ha probado a escala. Lo intentamos. Explicaré lo que aprendimos.

  • El aprendizaje de refuerzo es más útil para comprender el régimen de la acción y si hay algún VWAP o TWAP existentes activos en el mercado.
  • Demasiada volatilidad de los parámetros no es buena en las finanzas. Es difícil encontrar datos realmente fuera de muestra para probarlos.

Referencias

  • ¿Por qué los asesores financieros deben usar algoritmos de ejecución?
  • Diapositivas: AI y Trading una relación en evolución

Algunas de las técnicas se utilizan en el comercio autónomo de energía, es decir, redes inteligentes.

https://www.google.nl/url?sa=t&r