¿Cómo se pueden entender intuitivamente las dimensiones de las entradas LSTM?

(sample, time_steps, features) representa el tensor que alimentarás en tu LSTM, veamos estas tres “dimensiones” (lo llamamos rango para un tensor).

muestra: es el tamaño de su minibatch: cuántos ejemplos da a la vez a su red neuronal.

time_steps: esa es la longitud de una secuencia. No olvide que las redes neuronales recurrentes están diseñadas para procesar series temporales.

¿Cuál es la diferencia entre el análisis factorial exploratorio (EFA) y el análisis factorial confirmatorio (CFA)?
¿Qué es Distill y cuál es su importancia para la investigación de Machine Learning?
¿Qué factores además del conjunto de datos afectan cómo se elige el tamaño de lote para el descenso de gradiente estocástico (SGD) mini-lote?
¿Dónde puedo encontrar un buen tutorial para la red neuronal de convolución regional?
¿Qué tan difícil es entrenar idiomas indios con CMUSphinx?

características: esa es la dimensión de cada elemento de la serie temporal.

Digamos que intentamos modelar cómo vuela una abeja. Ponemos un sensor en la abeja, registramos su posición a 200Hz (200 cuadros por segundo) durante unos días.

Luego, entrena un LSTM utilizando la subsecuencia de esta grabación. Aquí, time_steps representará el número de fotogramas en la subsecuencia (por ejemplo, digamos 600 si proporciona 3 segundos) y las características serán iguales a tres, porque hemos registrado la posición espacial (x, y, z) de la abeja .

Espero que ayude 🙂

Aprendizaje automáticoMemoria a largo plazoRedes neuronales artificiales

¿Cuáles son los conjuntos de datos de visión por computadora más populares en este momento?

¿Puedo aprender el aprendizaje automático sin conocer álgebra lineal, estadísticas y probabilidad?

¿Hay alguna universidad en la India que ofrezca cursos a corto plazo sobre aprendizaje automático / ciencia de datos?

¿Cuánto del aprendizaje automático es en realidad solo optimización?

Comencé a aprender Machine Learning pero estoy luchando con conceptos matemáticos como la regresión lineal. ¿Cuál debería ser mi punto de partida en tal caso?

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

LSTM modela las probabilidades P (x_i | x_1, …, x_ (i-1)) dada una secuencia (x_1, .., x_n). Por lo tanto, los pasos de tiempo son la longitud de la secuencia. Debido a que cada elemento x_i está representado por un vector de características (por ejemplo, en la traducción automática, x_i es la incrustación de palabras de la palabra i_th en la oración), entonces las características son la dimensión del vector de características. La función de pérdida se estima mediante la entropía cruzada de un lote (un subconjunto de secuencias) definido por: [matemáticas] \ sum _ {(x_1, .. x_n) en un lote} \ sum_ {i} -log (P (x_i | x_1 , …, x_ (i-1))) [/ math]. Por lo tanto, las muestras son el número de secuencia en un lote

Théo BL

Brevemente se puede describir como: (número de ejemplos de entrenamiento en el lote; número de muestras de paso de tiempo en cada ejemplo de entrenamiento; número de características en cada muestra de paso de tiempo)

Egor Dezhic

More Interesting

¿Cuántos datos se producen diariamente y cómo se obtuvo esa cifra?

¿Qué hace que los parámetros del modelo sean variables latentes?

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

Cómo numerar los clústeres en la agrupación jerárquica de documentos en Python

¿Existe una conexión entre la ciencia de datos y el aprendizaje automático?

¿Puede el aprendizaje profundo predecir los dígitos de Pi?

¿Hay alguna empresa de software en Bangladesh que trabaje con ciencia de datos / ML / ANN / Visión por computadora?

¿Cómo se determina el tamaño del paso de actualización para el algoritmo de retropropagación ADADELTA?

¿Cómo se aplica el análisis tensorial al aprendizaje automático, en términos de contexto específico de aplicación?

¿Cómo se pueden engañar los modelos de clasificación existentes?