La palabra Vanilla en sí misma sugiere simple o llanamente.
Entonces, cuando necesita etiquetar, predecir el sucesor o generar secuencias más pequeñas, Vanilla RNN es extremadamente conveniente. Rambo trabaja en Amazon. Vea que esta es una secuencia simple donde solo hay un tema Rambo, etiquetar esto es muy fácil como Rambo \ Person, Amazon \ orgnization. Rambo trabaja en ———, el espacio en blanco también puede ser predicho fácilmente por cualquier organización a partir del vocabulario, ya que la secuencia es corta.
Ahora considere esto , conocí a Harry, quien me informó que el hermano de Ron, Rambo, se ha internado en Amazon y tiene muchos amigos en Google, aunque Rambo nunca ha trabajado para este gran conglomerado. Creo que obtienes la diferencia al predecir esto por el sabor simple o vainilla de LSTM es casi imposible.
- ¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?
- Andrew Ng: ¿Cuáles son los requisitos previos para iniciar el aprendizaje automático?
- ¿Cuántas imágenes necesita un buen sistema de aprendizaje automático para aprender un nuevo concepto?
- ¿Cómo se usa la informática en su trabajo / campo?
- ¿La validación cruzada más pequeña siempre es un indicador de un mejor modelo predictivo incluso si un modelo predictivo tiene una gran cantidad de parámetros?
Entonces, ¿qué diferencia tienen los dos? A diferencia de Vanilla Rnn, los LSTM tienen unidades de memoria entre ellos, también tienen un mecanismo para dejar caer al sujeto viejo ( de Harry a Ron a Rambo) en nuestro caso. Por lo tanto, los LSTM predicen mejores secuencias más largas.
Comprensión LSTM Networks visite esto para una mejor comprensión. Espero que esto ayude 🙂