Cuando supe por primera vez sobre RNN, leí la publicación de blog de Andrej Karpathy. [1] No es exactamente un tutorial, pero la publicación ofrece algunas ideas de alto nivel sobre lo que puede hacer un RNN y cómo funciona junto con algún código.
Escribió el código [2] que lo acompaña en Python y NumPy y lo puso en Github. El código no usa TensorFlow, pero si recién comienza a jugar con el código RNN, es un buen lugar para comenzar. Puede ejecutarlo prácticamente tal cual y producir algunos buenos resultados. Es un modelo simple de vainilla para RNN.
También puede ver la conferencia de Stanford [3] de Karpathy donde habla específicamente sobre ese fragmento de código. Presenta el modelo recurrente de vainilla a partir de las 7:42 en adelante, y luego habla sobre el código a partir de las 13:40 en adelante.
- Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python
- Como principiante, ¿dónde y cómo aprendo a implementar algoritmos difíciles de aprendizaje profundo y otras técnicas similares en los lenguajes OOP?
- ¿Me puede dar explicaciones completas de AI y ML?
- ¿Cómo funciona el soporte de regresión vectorial?
- ¿Qué algoritmo de aprendizaje automático debo usar cuando tengo 5-6 valores categóricos independientes y 1 variable continua dependiente?
Sin embargo, en términos de TensorFlow, si ya está familiarizado con RNN, debería poder encontrar un puerto del código vanilla char-RNN en algún lugar de Github haciendo una búsqueda rápida. Encontré esto: Vanilla Char-RNN usando TensorFlow, que se ve muy comparable.
Notas al pie
[1] La efectividad irracional de las redes neuronales recurrentes
[2] Modelo de lenguaje de nivel de caracteres mínimo con una red neuronal recurrente de vainilla, en Python / numpy
[3] CS231n Invierno 2016: Conferencia 10: Redes neuronales recurrentes, subtitulado de imágenes, LSTM