¿De dónde obtienen los algoritmos comerciales sus datos sin procesar?

Actualmente dirijo Operaciones en una de las plataformas de inversión cuantitativa más grandes de los EE. UU. (Quantiacs) y he desarrollado docenas de algoritmos en los últimos 5 años para poder responder con confianza a su pregunta.

La respuesta, por supuesto, es: depende de la naturaleza del algoritmo.

La gran mayoría de los algoritmos toman decisiones basadas solo en datos de precios y volúmenes. Si realiza operaciones intradía, deberá acceder a datos de ticks más granulares de un proveedor de datos o de su corredor. Aquí hay muchas opciones que van desde gratis hasta miles de dólares por mes. Supongo que no tiene el presupuesto para una Terminal Bloomberg, por lo que su mejor opción para obtener datos de tick a un precio razonable será a través de Kinetick o IQfeed. (No tengo ninguna relación con ninguno pero he usado ambos en el pasado) Espere pagar entre $ 60–150 por mes (un poco menos solo para los mercados de productos básicos).

Muchos algoritmos utilizan datos macroeconómicos directamente de agencias y entidades del gobierno de los Estados Unidos. Por ejemplo, la EIA proporciona datos gratuitos sobre muchas métricas económicas relacionadas con la producción, el almacenamiento y la importación / exportación de energía.

Otros algoritmos utilizan datos de opinión extraídos de las redes sociales u otras fuentes públicas. Estos algoritmos aprovechan las API de las principales empresas privadas en las redes sociales como Twitter y Facebook.

Algunos algoritmos similares aprovechan las fuentes de datos de ganancias y otros informes realizados por la SEC a través de la base de datos EDGAR y otras fuentes similares.

Finalmente, una de las mejores fuentes de datos que utilizan muchos algoritmos novedosos es Quandle (Quandl). Proporcionan datos asequibles de todas las variedades tanto a inversores profesionales como a particulares y los recomiendo encarecidamente.

De ninguna manera es una lista completa, sino que cubre la mayoría de las bases para la mayoría de las necesidades de datos de algoritmos. No dude en consultar todos los indicadores macroeconómicos que Quantiacs ofrece de forma gratuita en www.Quantiacs.com.

Todos los principales centros de comercio público hacen una disposición para distribuir cotizaciones de precios. Por lo general, los principales intercambios distribuyen datos de mercado a través de redes en sus propios centros de datos. Cada intercambio distribuye datos en su propio formato. Además de esto, los intercambios también pueden distribuir datos de mercado en ciertos formatos estándar como Fast Fix, ITCH, OUCH, etc.

Los datos del mercado también están disponibles a través de terceros como Reuters o Bloomberg. Además de esto, muchos corredores también proporcionan sus versiones de datos de mercado a sus clientes.

Los precios que ve en los sitios web generalmente provienen de uno de estos tipos de feeds.

Por lo general, los feeds más rápidos se encuentran en redes ubicadas. Incluso dentro de estos centros de datos ubicados, las personas en redes como Infiniband obtienen las actualizaciones de precios más rápido. Los datos de terceros como Reuters y Bloomberg tienden a ser más lentos a medida que estas compañías normalizan los datos en los intercambios.

Hoy en día, la difusión de los datos del mercado representa una importante fuente de ingresos para los centros de negociación.

El comercio cuantitativo es un área extremadamente sofisticada de las finanzas cuantitativas. Puede tomar una cantidad significativa de tiempo obtener el conocimiento necesario para pasar una entrevista o construir sus propias estrategias comerciales. No solo eso, sino que requiere una amplia experiencia en programación, al menos en un lenguaje como MATLAB, R o Python. Sin embargo, a medida que aumenta la frecuencia de negociación de la estrategia, los aspectos tecnológicos se vuelven mucho más relevantes. Por lo tanto, estar familiarizado con C / C ++ será de suma importancia.

Videos de operaciones diarias: # 1 Swing Trading Course

Muchas de las estrategias que analizará se incluirán en las categorías de reversión a la media y seguimiento de la tendencia / impulso. Una estrategia de reversión de la media es aquella que intenta explotar el hecho de que existe una media a largo plazo en una “serie de precios” (como el diferencial entre dos activos correlacionados) y que las desviaciones a corto plazo de esta media eventualmente revertirán. Una estrategia de impulso intenta explotar tanto la psicología de los inversores como la estructura de los grandes fondos al “engancharse” en una tendencia del mercado, que puede cobrar impulso en una dirección y seguir la tendencia hasta que se revierta.

Una vez que se ha identificado una estrategia, o un conjunto de estrategias, ahora se debe probar su rentabilidad con datos históricos. Ese es el dominio de backtesting.

Para llevar a cabo un procedimiento de backtest es necesario utilizar una plataforma de software. Puede elegir entre software dedicado de backtest, como Tradestation, una plataforma numérica como Excel o MATLAB o una implementación personalizada completa en un lenguaje de programación como Python o C ++. No me detendré demasiado en Tradestation (o similar), Excel o MATLAB, ya que creo en la creación de una pila de tecnología interna completa (por las razones que se detallan a continuación). Una de las ventajas de hacerlo es que el software de backtest y el sistema de ejecución pueden integrarse estrechamente, incluso con estrategias estadísticas extremadamente avanzadas. Para las estrategias HFT en particular, es esencial utilizar una implementación personalizada.

Al realizar una prueba inversa de un sistema, uno debe ser capaz de cuantificar qué tan bien está funcionando. Las métricas “estándar de la industria” para las estrategias cuantitativas son la reducción máxima y la relación de Sharpe. La reducción máxima caracteriza la mayor caída de pico a valle en la curva de capital de la cuenta durante un período de tiempo particular (generalmente anual). Esto se cita con mayor frecuencia como un porcentaje. Las estrategias LFT tenderán a tener reducciones mayores que las estrategias HFT, debido a una serie de factores estadísticos. Un backtest histórico mostrará la reducción máxima pasada, que es una buena guía para el rendimiento de la estrategia en la reducción futura. La segunda medida es la relación de Sharpe, que se define heurísticamente como el promedio de los retornos en exceso dividido por la desviación estándar de esos retornos en exceso. Aquí, el exceso de rendimiento se refiere al rendimiento de la estrategia por encima de un punto de referencia predeterminado, como el S & P500 o un Bono del Tesoro a 3 meses. Tenga en cuenta que el rendimiento anualizado no es una medida utilizada habitualmente, ya que no tiene en cuenta la volatilidad de la estrategia (a diferencia de la relación de Sharpe).

En un fondo más grande, a menudo no es dominio del operador cuantitativo optimizar la ejecución. Sin embargo, en tiendas más pequeñas o firmas HFT, los comerciantes SON los ejecutores, por lo que a menudo es deseable un conjunto de habilidades mucho más amplio. Tenga esto en cuenta si desea ser empleado de un fondo. ¡Sus habilidades de programación serán tan importantes, si no más, que sus estadísticas y talentos econométricos!

La pieza final del rompecabezas de comercio cuantitativo es el proceso de gestión de riesgos. El “riesgo” incluye todos los sesgos anteriores que hemos discutido. Incluye riesgos tecnológicos, como los servidores que se ubican en el intercambio y que de repente desarrollan un mal funcionamiento del disco duro. Incluye el riesgo de corretaje, como que el corredor se declare en quiebra (¡no tan loco como parece, dado el reciente susto con MF Global!). En resumen, cubre casi todo lo que podría interferir con la implementación comercial, de las cuales hay muchas fuentes. Libros enteros están dedicados a la gestión de riesgos para estrategias cuantitativas, por lo que no intentaré dilucidar todas las posibles fuentes de riesgo aquí.

Si está interesado en tratar de crear sus propias estrategias de negociación algorítmica, mi primera sugerencia sería ser bueno en la programación. Prefiero construir la mayor cantidad posible de captura de datos, analizador de estrategias y sistema de ejecución. Si su propio capital está en juego, ¿no dormiría mejor por la noche sabiendo que ha probado completamente su sistema y que es consciente de sus dificultades y problemas particulares? Subcontratar esto a un proveedor, aunque potencialmente ahorre tiempo a corto plazo, podría ser extremadamente costoso a largo plazo.

Gratis

Yahoo Finanzas

Google Finance

Quantiacs

Quandl

Alpha-vantage

FXCM

Pagado

Kinetick

Quanthouse

Alimentación de datos global

Economía comercial

Thomson Reuters

Activ

Además de esto, hay muchos otros proveedores de datos que están disponibles. Los proveedores de datos en la lista mencionada aquí consisten en fuentes de datos pagas y gratuitas. Otra cosa importante a tener en cuenta es que muchos de los proveedores mencionados anteriormente están en el lado del comercio algorítmico ahora.

Hay dos conceptos para hacer uso de estos datos, el primero es tener acceso a los datos descargables y el segundo es donde no puede descargar los datos pero puede usarlos directamente en una plataforma. En el segundo caso, puede obtener los datos a través de la API o escribir un pequeño script o programa y obtener los datos.

Los proveedores que proporcionan datos pagados como se menciona en la lista pueden ayudarlo con los datos de marca, los segundos, los minutos o los datos durante la noche, dependiendo de con qué avance.

Las compañías de datos de mercado venden datos, en tiempo real o datos históricos “tick”.
Tickdata, una empresa de VA, tiene y proporciona datos para este tipo de proyecto. Por lo general, le envían un archivo enorme que tiene lo que solicita. Marca de tiempo, b, a, impresión, etc.

Aquí hay una publicación de blog en la que he mencionado sobre el abastecimiento de datos para ejecutar estrategias de negociación algorítmica. La publicación del blog es más desde el punto de vista de los comerciantes minoristas que desean iniciarse en el comercio algorítmico …

5 cosas que debe saber antes de comenzar el comercio algorítmico

Tienen una suscripción a la bolsa de valores.