Veo las redes de memoria como una solución interesante al problema de la memoria limitada en otras formulaciones de red como redes recurrentes / LSTM, etc. En tales redes, algunas recurrencias como [math] h_t = f (h_ {t-1}, x_t) [ / math] se sigue para actualizar algún estado oculto. La función [matemática] f (.) [/ Matemática] es generalmente sublineal, lo que resulta en el hecho de que la influencia del estado de [matemática] k [/ matemática] pasos anteriores disminuye exponencialmente como [matemática] k \ rightarrow \ infty [ /mates]. Las redes de memoria almacenan todo el estado de una entrada dada en un almacenamiento de memoria, lo que significa que uno puede “consultar” en la memoria los “ajustes” adecuados a las preguntas que surgieron muchos pasos atrás. Los autores demuestran esta capacidad de la formulación de la red de memoria al desempeñarse bien en tareas de preguntas y respuestas donde la respuesta aparece una gran distancia antes de la pregunta.
¿Cómo describirías las redes de memoria?
Related Content
¿Cuál es un buen tema de investigación de pregrado en visión por computadora?
¿Cuáles son las buenas opciones de investigación en informática en India?
¿Cuáles son los temas de actualidad en investigación matemática?
More Interesting
¿Cuál es la mejor manera de hacer investigación CS en Stanford como estudiante?
¿Cuáles son algunos documentos notables en la investigación de lenguajes de programación?
¿Cómo exactamente los procesadores cuánticos logran una velocidad exponencial?
¿Cuáles son los mejores grupos de investigación de geometría computacional en los Estados Unidos?
¿Cuáles son las preguntas / temas de investigación más importantes en filosofía hoy?
¿Cómo es el campo de la seguridad informática en comparación con la programación?
¿Cómo calificaría la investigación de sistemas CS en UwiscMad, UT Austin, UMich y GATech?
¿Cuáles son algunos temas candentes en la investigación en nanotecnología?
¿La Facultad de Ingeniería Poonjar está produciendo ingenieros informáticos de clase mundial?