¿Es realmente posible usar clasificadores de aprendizaje automático listos para usar como SVM o Random Forest para predecir con precisión la dirección del stock?

Eso es altamente improbable.

En principio, puede usar clasificadores para predecir un retorno en el futuro en función de los retornos en el pasado. El número de clases posibles utilizadas determina la “resolución” de la predicción. Un algoritmo de dos clases solo puede predecir, digamos, el signo del regreso de mañana. Fácil, verdad?

Entonces, ¿dónde está la trampa? Bien:

  1. Cualquiera que tenga un entrenamiento básico en ML puede hacer eso. Y cualquier científico de ML que piense que es injusto que haya pagado una fracción de lo que obtienen los muchachos de las finanzas lo ha intentado. Si encuentra algo que realmente funciona, no se lo dice a nadie, ¿no (vea el punto 6 a continuación)?
  2. En la vida real, las estrategias de negociación no funcionan como se esperaba: ¿entrenó su algoritmo en los precios de cierre de algunas acciones (la que generalmente se cotiza)? Mala suerte, no lo conseguirás.
  3. Tener razón en su predicción más a menudo que mal no significa que realmente ganará dinero. Podrías estar muy equivocado cuando te equivocas.
  4. Incluso si parece estar ganando dinero (por ejemplo, la distribución de las ganancias y pérdidas de sus operaciones tiene una media positiva), podría estar expuesto a riesgos de cola. El problema con las estrategias comerciales es que las distribuciones P / L a menudo están sesgadas y altamente kurtóticas.
  5. Probablemente entrenarás tu algoritmo para hacer intercambios abarrotados. Estos son los que son fáciles de detectar, que funcionan bien por un tiempo, pero a menudo son difíciles de eliminar.
  6. Y por último: suponiendo que los mercados no sean totalmente ineficientes, cualquier señal comercial se detectará y comercializará. Esto reduce en gran medida el potencial de ganar dinero con él.

Así que estoy de acuerdo con usted: las afirmaciones en estos documentos son un poco dudosas.

Esta es una de las muchas cosas con las que jugué cuando estaba haciendo mi doctorado en series de tiempo.

No es el mercado de valores: la predicción de subida o bajada.

Y, como era de esperar, las clasificaciones más precisas de una serie de tiempo de forma conocida no se podían distinguir.

En general, de todos modos.

¿Aplicación de eso al mercado de valores?

Por favor.

Jugar con la clasificación de dirección me llevó a algunas de mis investigaciones privadas sobre el aumento de la capacidad de ciertos algoritmos de ML para lidiar mejor con la autocorrelación.

El año pasado, alguien se me acercó para unirme a una startup sobre la predicción del mercado de valores. Se estaba acercando a todo tipo de investigadores, y creo que me encontró aquí en Quora.

Rechacé El salario ofrecido era bastante bueno, era completamente remoto, etc., etc.

Había hecho un poco de investigación privada sobre la imprevisibilidad inherente del mercado de valores, y le dije que su idea estaba condenada.

No me creyó, pero como ya no está tratando de trabajar en su idea, supongo que él mismo lo ha verificado. O alguien le dio algo más sólido en términos de evidencia. O tal vez simplemente no podía atraer talento.

Nota: el mercado de valores no es “solo una caminata aleatoria”, de alguna manera, es mucho peor. Hay demasiada información disponible, y los factores externos ahora tienen demasiada influencia en el mercado.

Si está interesado en verificar el rendimiento de una estrategia comercial utilizando técnicas de aprendizaje automático, le recomiendo usar Quantopian para realizar una prueba inversa de un clasificador de bosque aleatorio contra el punto de referencia de SPY:

Ejemplo simple de aprendizaje automático Mk II

El aprendizaje automático puede ser útil para seleccionar factores alfa predictivos de retorno como se describe en el siguiente cuaderno Cuantopiano:

Machine Learning en Quantopian

El aprendizaje automático también se puede utilizar para encontrar grupos de acciones (K-means, GMM) para estrategias de negociación de pares, descubrir componentes principales (PCA) para estrategias de reversión a la media y predecir estados de mercado latentes (HMM, Filtro de Kalman).

SVM y Random Forest son algoritmos de clasificación. Son algoritmos apropiados para agrupar procesos aleatorios, pero no para la predicción. Entonces, si sabemos que un grupo de procesos (series de tiempo) pertenecen juntos, independientemente del por qué, que es una gran desventaja de esta línea de razonamiento, entonces es lógico que un cambio en uno de estos procesos debería estar sucediendo a todos de ellos.

El problema con este razonamiento es que el hecho de que dos o más procesos aleatorios se muevan juntos ahora, no significa que lo harán en el futuro.

Y es por eso que no puede usar este enfoque para predecir los movimientos del mercado de valores.

  1. Machine Learning tiene potencial en finanzas cuantitativas
  2. Tratar de predecir la dirección es una tarea tonta

No sé por qué la gente está tan obsesionada con predecir la dirección. Por lo general, esto me dice que el proyecto fue iniciado por alguien de la academia sin exposición en el mercado. No tendrá ninguna posibilidad de éxito.

Intentar predecir los precios futuros es aún peor.

Existen innumerables otras formas de hacer que los datos de clasificación sean útiles en el comercio. ML es bueno para ciertas cosas. No tuerza su brazo solo para obtener algunas señales de negociación desagradables.

More Interesting

¿Qué cosas debo saber antes de realizar una disertación en aprendizaje automático?

¿Crees que un asistente personal de inteligencia artificial puede resolver problemas fundamentales de productividad?

¿Cuál es el estado relativo de las publicaciones en revistas y conferencias en Robótica?

¿Es mentalmente saludable permitir que los niños jueguen con juegos artificialmente inteligentes y osos de peluche que interactúan con ellos?

¿Es posible entrenar a una IA en datos sísmicos para predecir efectivamente los terremotos?

¿Cuáles son algunos de los problemas abiertos bien definidos en IA, robótica y ML?

¿Cómo se relaciona la inteligencia artificial con la inteligencia empresarial?

¿Alguien experimentó con una red neuronal, que está capacitada en el flujo de noticias como entrada y los precios de las acciones como salida?

¿Lloyd Pye aborda el hecho de que una civilización avanzada podría extraer su propio oro sin esclavos utilizando Ai y equipos industriales?

¿Cuál es el siguiente paso más allá del aprendizaje profundo en IA?

¿Cuál es el mayor obstáculo cuando se trata de realizar un ser humano como la IA?

¿Cómo funciona el algoritmo de ciencia de datos / aprendizaje automático de Piedmont Media para clasificar guiones de películas?

¿Cómo se puede utilizar la tecnología más avanzada hoy en día (ML / AI / Adv. Computing) para combatir el racismo y la ideología supremacista?

¿Cuál es la diferencia entre las clases de inteligencia artificial?

Supongamos que hay una red neuronal con 4 unidades ocultas y 1 capa oculta y otro NN con 2 capas ocultas, cada una con 2 unidades, ¿cuál es la diferencia?