¿Cómo se ve afectada la propagación hacia atrás en NN recurrentes?

El algoritmo de retropropagación puede funcionar en redes neuronales recurrentes, y estos modelos pueden comportarse razonablemente bien, al menos en la dirección de avance. El problema es la naturaleza supervisada del aprendizaje de propagación hacia atrás.

Normalmente en backprop, tiene un ejemplo de salida correcta (la “verdad de tierra”) para usar como una “señal de supervisión” para entrenar la red. Esta respuesta correcta se utiliza para generar valores de error, que luego se propagan hacia atrás a través de la red.

Pero cuando la red es recurrente, ¿cuál es la “verdad fundamental” para las salidas que retroalimentan las entradas?

Una vez que la red se está ejecutando, se podría ejecutar la red hacia atrás por el mismo número de pasos, y comenzar el proceso sin señal de error para la salida recurrente en la primera iteración. Iniciar la red para cada muestra de entrenamiento también podría ser complicado, ya que un estado inicial para los nodos recurrentes (¿todos ceros?) Será artificial y no representativo de la dinámica convergente estable (si converge, lo que puede no ser posible).

More Interesting

¿Es cierto que las Redes Adversarias Generativas (GAN) aprenden la función de pérdida automáticamente, y si es así, cómo?

Sistemas móviles: ¿Qué empresas / organizaciones de investigación están trabajando en el área de análisis de comportamiento / sistemas colaborativos basados ​​en dispositivos móviles?

¿Cuáles son las distribuciones bayesianas anteriores y posteriores? ¿Cuáles son sus roles en las redes neuronales?

¿Cuáles son los temas de investigación sobre aprendizaje profundo para la tesis de maestría?

¿Por qué en cualquier máquina eléctrica la corriente aumenta cuando aumenta la carga de esa máquina?

¿Cuáles son los últimos desarrollos en clasificación?

Cómo combinar clasificador basado en reglas y SVM

¿Cuáles son algunos de los mejores algoritmos de aprendizaje automático, considerando la eficiencia, la facilidad de implementación, etc.?

Cómo modelar el problema de un número de generación matka usando machine learning

¿Cuáles son las diferentes técnicas para el procesamiento del lenguaje natural para resolver un ensayo de clasificación automática?

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

¿Cuál es tu algoritmo de aprendizaje automático favorito?

¿Existe una lista de conferencias de minería de datos / aprendizaje automático organizadas en los Estados Unidos?

¿Qué algoritmo puedo implementar para hacer una reducción de dimensión con restricción no negativa? (PCA se asignará al espacio negativo)

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?