Empecé a aprender sobre RNN hace aproximadamente 1 año. De diferentes fuentes, principalmente documentos e implementaciones.
Pasé mucho tiempo en ello, pero dos guías lo dejaron claro:
- La efectividad irracional de las redes neuronales recurrentes
- Comprender las redes LSTM
Ambos son ampliamente referencia cuando se trata de la introducción de RNN, porque es extremadamente relevante.
- Cómo encontrar un patrón repetido en una imagen
- ¿Qué son los vectores de características basados en cuadros (como se usan en el reconocimiento de voz)?
- ¿Cuál es el punto de ejecutar un modelo de regresión logística antes de un árbol de decisión?
- ¿Cómo se glorifican los métodos del kernel en la coincidencia de plantillas?
- ¿Funciona el aprendizaje profundo si las entradas están en un espacio dimensional relativamente bajo?
Ahora, no esperes leerlo en 10 minutos y dominar el tema. En cambio, pasa todo el tiempo que puedas en él, ¡vale la pena cada segundo! Intenta tomar notas y jugar con el código.
Después de hacer esto, le sugiero que mire los casos de uso basados en RNN, por ejemplo, en los tutoriales de TensorFlow o Pytorch. (Redes neuronales recurrentes | TensorFlow, clasificación de nombres con un RNN de nivel de caracteres, ambos requieren un conocimiento previo de la estructura c).