Depende del conjunto de datos utilizado como ya se mencionó y principalmente del problema que se está resolviendo.
Si, por ejemplo, queremos pronosticar el precio de mercado de una acción cuyo precio depende de otras acciones en la canasta, entonces tenemos un conjunto de características que es esencialmente una serie de tiempo multivariante y también queremos considerar el orden en que se alimenta la secuencia en el modelo, se convierte en un aspecto importante para configurar el tamaño del mini lote.
Entonces, para establecer un tamaño de lote mini que es esencialmente una serie de tiempo propia, ahora debemos considerar la ventana de agregación de precios, es decir, si queremos considerar la capacitación en un modelo para aproximar el precio promedio ponderado de las existencias durante la última semana o un mes para predecir el precio de las acciones. En cuyo caso, la semana o el mes se convertirá en el tamaño del mini lote.
- Cómo lidiar con un conjunto de datos duro que no me da buenos resultados en la validación del modelo
- ¿Cómo se realiza el aprendizaje automático supervisado cuando sus datos no caben en una sola máquina? ¿Los clasificadores de libros de texto como los clasificadores SVM o Naive Bayes siguen siendo tan importantes o incluso factibles a medida que aumenta el tamaño de sus datos o los algoritmos diferentes se vuelven más populares?
- ¿Las redes de cápsulas reemplazarán a las redes neuronales?
- ¿Cuáles son las diferencias, similitudes, pros, contras, aplicaciones y descripciones de Keras, TensorFlow, Theano?
- ¿Cómo sabes que tienes que "maximizar" el lagrangiano para resolver el problema dual?
Entonces, si tenemos N puntos de datos, h unidades ocultas (celdas / bloques LSTM), b como tamaño de mini lote, entonces el alumno necesitará int (N / b) +1 épocas para pasar por todos los puntos de datos una vez.
En un caso específico de LSTM RNN, depende de qué tan bien quiera recordar el pasado. Si el tamaño de Mini Batch es de 10 días, esencialmente tenemos un modelo que generaliza durante días los datos secuenciales.