¿Qué factores además del conjunto de datos afectan cómo se elige el tamaño de lote para el descenso de gradiente estocástico (SGD) mini-lote?

Depende del conjunto de datos utilizado como ya se mencionó y principalmente del problema que se está resolviendo.

Si, por ejemplo, queremos pronosticar el precio de mercado de una acción cuyo precio depende de otras acciones en la canasta, entonces tenemos un conjunto de características que es esencialmente una serie de tiempo multivariante y también queremos considerar el orden en que se alimenta la secuencia en el modelo, se convierte en un aspecto importante para configurar el tamaño del mini lote.

Entonces, para establecer un tamaño de lote mini que es esencialmente una serie de tiempo propia, ahora debemos considerar la ventana de agregación de precios, es decir, si queremos considerar la capacitación en un modelo para aproximar el precio promedio ponderado de las existencias durante la última semana o un mes para predecir el precio de las acciones. En cuyo caso, la semana o el mes se convertirá en el tamaño del mini lote.

Entonces, si tenemos N puntos de datos, h unidades ocultas (celdas / bloques LSTM), b como tamaño de mini lote, entonces el alumno necesitará int (N / b) +1 épocas para pasar por todos los puntos de datos una vez.

En un caso específico de LSTM RNN, depende de qué tan bien quiera recordar el pasado. Si el tamaño de Mini Batch es de 10 días, esencialmente tenemos un modelo que generaliza durante días los datos secuenciales.