¿Cómo describirías las redes de memoria?

Veo las redes de memoria como una solución interesante al problema de la memoria limitada en otras formulaciones de red como redes recurrentes / LSTM, etc. En tales redes, algunas recurrencias como [math] h_t = f (h_ {t-1}, x_t) [ / math] se sigue para actualizar algún estado oculto. La función [matemática] f (.) [/ Matemática] es generalmente sublineal, lo que resulta en el hecho de que la influencia del estado de [matemática] k [/ matemática] pasos anteriores disminuye exponencialmente como [matemática] k \ rightarrow \ infty [ /mates]. Las redes de memoria almacenan todo el estado de una entrada dada en un almacenamiento de memoria, lo que significa que uno puede “consultar” en la memoria los “ajustes” adecuados a las preguntas que surgieron muchos pasos atrás. Los autores demuestran esta capacidad de la formulación de la red de memoria al desempeñarse bien en tareas de preguntas y respuestas donde la respuesta aparece una gran distancia antes de la pregunta.

More Interesting

¿La investigación académica de CS es realmente valiosa? No he encontrado casi nada valioso o innovador en ellas (excepto casos muy raros en los que los autores tienen una conexión muy estrecha con la industria).

¿Cuál es la mejor manera de hacer investigación CS en Stanford como estudiante?

¿Cuáles son los pasos (para un estudiante indio) para escribir un trabajo de investigación en ciencias de la computación sin la ayuda de profesores universitarios?

Computational Science (Scientific Computing): ¿Cuál es el alcance de un estudiante de física BS interesado en CS y programación?

¿Cuáles son algunos documentos notables en la investigación de lenguajes de programación?

¿Cómo exactamente los procesadores cuánticos logran una velocidad exponencial?

¿Cuáles son los mejores grupos de investigación de geometría computacional en los Estados Unidos?

¿Cuáles son las preguntas / temas de investigación más importantes en filosofía hoy?

¿Cómo es el campo de la seguridad informática en comparación con la programación?

Como estudiante universitario sin un asesor, ¿cómo realizo una investigación en los campos de VLSI, arquitecturas informáticas y sistemas de baja potencia con el objetivo de publicar artículos en revistas / conferencias de renombre? ¿Cómo planeo publicar artículos?

¿Cuál es el lenguaje de programación que debo elegir para realizar una investigación en el área de Visión por Computador?

¿Cómo calificaría la investigación de sistemas CS en UwiscMad, UT Austin, UMich y GATech?

¿Cuáles son algunos temas candentes en la investigación en nanotecnología?

¿La Facultad de Ingeniería Poonjar está produciendo ingenieros informáticos de clase mundial?

¿Qué hacen los investigadores de seguridad informática?