TL: DR
Las técnicas y herramientas de aprendizaje automático tienen un espacio de problema implícito donde pueden ser extremadamente efectivas. Se pueden aplicar con éxito a los datos financieros si encuentra el tipo correcto de problema. Pero a pesar de que tenemos una herramienta más avanzada, nos enfrentamos a otro enigma y nos encontramos con un problema apropiado. Esencialmente, hemos reemplazado un martillo (regresión lineal) y un destornillador (ARIMA) con un taladro eléctrico (ML: KNN, RF, SVM, ect,) mientras que definitivamente puede comenzar a perforar (arrojando todo tipo de datos) en cualquier lugar que desee, pero lo más probable es que sea bastante tonto si no piensa en comprender la herramienta y el tipo de problemas que puede resolver.
Respuesta larga
- ¿En qué tipo de situaciones debemos emplear las redes neuronales recurrentes de Vanilla en lugar de LSTM?
- ¿Cuál es la diferencia entre Deep Autoencoders y Deep Belief Networks?
- ¿Cuántos selfies debe leer un Machine Learning antes de poder discernir el origen étnico?
- ¿Cómo determinaría si el error de cuando ejecuta su algoritmo de aprendizaje automático es de alto sesgo o alta varianza (también conocido como corte o sobreajuste)?
- ¿Qué áreas del aprendizaje automático son más importantes para los fondos de cobertura y los bancos de inversión (en equipos cuantitativos)?
He aplicado el aprendizaje automático a una variedad de estrategias algorítmicas, pero con resultados variables. Aquí hay varios desafíos que encontré (no dude en corregirme o agregar / comentar)
Los datos del mercado no son iid y estacionarios.
La mayoría de las veces cuando aplicamos ML en los datos del mercado, estamos utilizando algún tipo de clasificación, regresión, técnica de reducción dimensional o una combinación de estos. La mayoría de las técnicas de ML asumen que el proceso de generación de datos es estacionario e iid. Si utiliza estas técnicas para ajustar los datos del mercado, puede funcionar bien en un régimen (datos de capacitación), pero puede ser completamente ineficaz en otro régimen (datos de prueba, fuera de la muestra).
Los datos del mercado exhiben una alta relación ruido / señal.
Algunas técnicas de ML asumen muestras de iid, este es un gran problema, porque no todas las señales se crean de la misma manera . Si un modelo está entrenado en datos que se deben principalmente a la posibilidad aleatoria y al ruido, el modelo estará sobreajustado con señales débiles. Cuando el modelo se usa para la predicción, puede generar costosas señales falsas. Hacer que la estrategia sea altamente volátil y / o inconsistentemente rentable. (por supuesto, esto se puede mejorar, es decir, registro, embolsado y ect). Esto no es en lo que quieres poner tu dinero.
Idealmente, el modelo necesita generar señales predictivas que aprovechen una fluctuación o una fijación de precios lo suficientemente grande, en la que después de los costos aún puede capturar algo de alfa. Además, las ganancias de sus verdaderos positivos deben superar las pérdidas de los falsos positivos de manera consistente.
Señal vs realidad
A veces, su modelo puede producir una señal de generación alfa, pero después de la ejecución, el deslizamiento y la oferta y la demanda difunden la estrategia puede ser poco práctica.
En resumen, el aprendizaje automático se puede aplicar con éxito al comercio algorítmico. Pero tienes que tenga en cuenta las fortalezas y debilidades de la técnica de ML, y sea inteligente al seleccionar el contexto adecuado para aplicar estas herramientas, es decir, limite el espacio del problema en el que son aplicables estas técnicas.
Algunas referencias y discusiones que encontré útiles o relevantes:
Aplicaciones financieras del aprendizaje automático
¿Previsión del mercado de valores mediante el aprendizaje profundo? • / r / MachineLearning