¿Es una red neuronal completamente conectada igual a una red neuronal de retroalimentación?

La arquitectura de avance implica la ausencia de conexiones recurrentes o de retroalimentación. El camino solo mira hacia adelante, no hay conexiones de alimentación hacia atrás entre las neuronas. Por lo tanto, la señal solo se puede alimentar hacia adelante, de ahí el nombre de red neuronal de alimentación hacia adelante (NN).

Existen muchos tipos de NN de avance, como:

  1. Redes neuronales multicapa totalmente conectadas, como los perceptrones multicapa (MLP).
  2. Redes neuronales totalmente convolucionales.
  3. Redes neuronales convolucionales + capas completamente conectadas (normalmente llamadas redes neuronales convolucionales)

Hay otro grupo llamado redes neuronales recurrentes (RNN) con conexiones recurrentes o de retroalimentación entre las neuronas. Dichas redes se están completando, en el sentido de que pueden aprender cualquier función, funciones espaciales + temporales. Ejemplos de RNN son:

  1. Vanilla RNN que sufre principalmente de un problema de gradiente de desaparición / explosión.
  2. Redes de memoria a corto y largo plazo (LSTM).
  3. Redes de unidad recurrente cerrada (GRU).
  4. Redes neuronales convolucionales recurrentes (RCNN).

Otra variante son las llamadas redes neuronales aumentadas de memoria o redes de memoria en resumen. Como su nombre lo indica, se trata de un bloque de memoria conectado a una red neuronal. De alguna manera pueden aprender a razonar. Los ejemplos de NN aumentados de memoria son:

  1. Máquinas de tensión neural (NTM)
  2. Computadoras neuronales diferenciables (DNC).

Normalmente en cada grupo hay arquitecturas más extrañas.

Espero que esto ayude.

More Interesting

¿Hay algún sitio web donde pueda encontrar ideas para mi tesis de licenciatura en Informática? (Estoy interesado en algoritmos y aprendizaje automático).

¿Por qué hay tantos enfoques generativos en la clasificación de escenas, mientras que el enfoque discriminatorio es el principal en el reconocimiento / detección de objetos?

¿Por qué podría ser preferible incluir menos predictores sobre muchos?

¿Cuáles son las aplicaciones del aprendizaje automático en optometría y ciencias de la visión?

¿Somos mejores que las máquinas que creamos?

¿Cuál es el método del núcleo? ¿Cómo se usa en los sistemas de recomendación?

¿Cuáles son algunos estudios de caso excelentes en el aprendizaje automático?

Cómo desarrollar una aplicación que reproduzca música de acuerdo a tu estado de ánimo

¿Hay algún kit de herramientas LSTM disponible en MATLAB?

¿Puede el aprendizaje profundo manejar datos desequilibrados?

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

¿Qué ha causado la gran mejora en los algoritmos de reconocimiento de voz en los últimos años: mejores algoritmos (si es así, ¿cuál?) O la mayor potencia informática?

¿Puedo comenzar a aprender el aprendizaje automático y el aprendizaje profundo sin repasar primero mis conocimientos de matemáticas?

¿Qué tan importante es la optimización de hiperparámetros en los modelos gráficos bayesianos, como la asignación de Dirichlet latente?

¿Qué se enseña en los cursos de posgrado de aprendizaje automático?