¿Tiene sentido el uso de bosques aleatorios en los datos financieros si se supone que los rendimientos dependen en serie (es decir, que los rendimientos actuales dependen de los rendimientos pasados)?

Si los retornos no dependen en serie, entonces no hay ningún método de aprendizaje automático que funcione para predecir retornos futuros y, por lo tanto, sería imposible realizar intercambios direccionales rentables en la serie de tiempo en cuestión.

Es decir, si [matemáticas] E [r_t | X_ {t-1}] = \ mu [/ math], donde [math] X_ {t-1} [/ math] es toda la información conocida en el momento [math] t-1 [/ math] y [math] \ mu [/ math] es un rendimiento promedio constante, entonces realmente no importa si usa bosques aleatorios, aumento, embolsado, regresión lineal simple: no hay características del tiempo [math] t-1 [/ math] o anterior puede predecir el retorno futuro.

Entonces, si bien es difícil decir para una serie de tiempo específica y características específicas si los bosques aleatorios serán útiles si hay una dependencia en serie, definitivamente son potencialmente útiles solo si hay una dependencia en serie.

Respuesta corta: depende de tus características.

Supongamos que cada conjunto de datos es una serie de tiempo con mediciones [matemáticas] N [/ matemáticas]. Si [math] N [/ math] es grande, necesitará un conjunto de entrenamiento enorme si simplemente conecta las mediciones individuales. El número de conjuntos de datos debe ser al menos mayor que el número de características.

Cuando se ha dicho eso, si extrae buenas características, un bosque aleatorio es una excelente idea. Pero creo que todo se reduce a la extracción de características de la serie temporal … La autocorrelación y las transformaciones de Fourier probablemente no sean un mal lugar para comenzar.