¿Qué diferencia exactamente una red neuronal recurrente de una red de alimentación directa con una ventana de tiempo limitado?

Las redes neuronales recurrentes eliminan la suposición de Markovian.

Si considera la red neuronal de avance con una ventana de tiempo limitada, está haciendo que su modelo se base en un contexto limitado y, por lo tanto, supone que después de cierto punto, el contexto no importa. Esto es lo que hacen los modelos ocultos de Markov.

Las redes neuronales recurrentes (en teoría) permiten que persista información de un número ilimitado de pasos anteriores. Esto sucede porque la salida en cada paso está influenciada tanto por la entrada actual como por la salida anterior. Es decir, la entrada 1 influye en la salida 1, que influye en la salida 2, y así, siempre que lo desee, de modo que la entrada 1 afecta a la última salida. Definitivamente, este no es el caso con la red feedforward que analiza un contexto de tamaño fijo.

PD: la razón por la que digo que esto es cierto solo en teoría es que los RNN simples en realidad tienden a olvidar la información del pasado muy rápidamente. Las soluciones a esto son usar RNN cerrados que tengan buena persistencia de memoria, como GRU y LSTM.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Serán obsoletas las técnicas de programación lineal y optimización matemática en el futuro?

¿Deberíamos tener miedo de la IA?

¿Cómo probarás en un chat que eres humano, no una máquina?

Cómo crear un algoritmo de red neuronal para una clasificación de intención de consulta de chatbot

Quiero escribir un trabajo de investigación sobre inteligencia artificial, ¿qué debo hacer para comenzar?

¿Twitter ampliará alguna vez su límite de caracteres?

¿Cómo afectará la IA al mercado laboral de los países en desarrollo?

El RNN tiene la salida de cada neurona conectada con la entrada de cada neauron, mientras que la red FF con una ventana de tiempo tiene la salida de la capa de salida conectada con la entrada del NN.

Himanshu Kumar

More Interesting

¿La conducción autónoma es un aprendizaje de refuerzo?

¿Se puede usar Quora en una prueba de Turing?

¿Cómo se comportaría una red neuronal híbrida?

¿Podría la inteligencia artificial resolver el problema de unificar la teoría de la relatividad general con la mecánica cuántica o diría: 'Imposible'?

¿Cómo se pueden visualizar las características extraídas en capas ocultas de una red neuronal?

¿Deberían los robots y otras IA tener un estatus humano?

¿Vale la pena aprender HTML o los creadores de sitios web y la inteligencia artificial lo volverán inútil en el futuro?

¿Existe alguna relación entre la teoría de juegos y las redes neuronales?

¿Por qué un cambio interno de covariable ralentiza el procedimiento de entrenamiento?

¿Cuál es la percepción del trabajo de aprendizaje automático y el talento en Microsoft?

¿Cuál es el robot móvil más avanzado producido en masa?

¿Qué es incrustar en Machine Learning? ¿Podría dar un ejemplo / explicación simple?

¿Qué temas debo saber en PNL?

¿Qué tan lejos estamos de poder programar una computadora para distinguir buena música de mala música o ruido, de forma similar a como lo hace un humano?

¿Cuánto tiempo se detiene una computadora cuando juega contra un humano durante una partida de ajedrez?

Web Analytics