En Tensorflow: ¿qué tipo de red neuronal debo usar?

¿Quizás elegir una celda LSTM es una mejor idea?

Lea más aquí: Redes neuronales recurrentes

Lea también esto para una gran introducción a LSTM:

Comprender las redes LSTM

lstm = rnn_cell.BasicLSTMCell (lstm_size)
# Estado inicial de la memoria LSTM.
estado = tf.zeros ([lote_tamaño, lstm.state_size])
probabilidades = []
pérdida = 0.0
para current_batch_of_words en words_in_dataset:
# El valor del estado se actualiza después de procesar cada lote de palabras.
salida, estado = lstm (current_batch_of_words, estado)

# La salida LSTM se puede usar para hacer predicciones de la siguiente palabra
logits = tf.matmul (salida, softmax_w) + softmax_b
probabilidades.append (tf.nn.softmax (logits))
pérdida + = pérdida_función (probabilidades, palabras_objetivas)

En primer lugar, el análisis de flujo de tensor requiere el procesamiento de números. Las ANN (redes neuronales de atractores) no son capaces de descifrar los números correctamente. Las redes neuronales atrayentes (ANN) están diseñadas para tareas que realizan máquinas de patrones y análisis de patrones. En consecuencia, debe ver si puede reformar el problema del análisis de flujo de tensor en un problema de procesamiento basado en patrones. De lo contrario, la tarea que desea hacer será inútil. Robotronics LLC | Facebook

More Interesting

¿Qué carrera es mejor, Machine Learning o DevOps?

¿Cuáles son algunos talleres sobre aprendizaje a gran escala?

¿El aprendizaje por refuerzo es escalable?

¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?

¿Existe una relación entre el aprendizaje automático y los procesos estocásticos?

¿Cuáles son algunas aplicaciones de la vida real del aprendizaje automático además de las aplicaciones relacionadas con la web?

¿Qué es el mecanismo de atención en redes neuronales?

¿Cuáles son las principales aplicaciones potenciales para un cordón neural? ¿Hay algún peligro relacionado con el uso de dicha tecnología?

¿Podemos vender potencia informática a empresas de aprendizaje automático? ¿Cuál es la dificultad de hacer eso?

¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?

¿Cómo evalúa el rendimiento de un algoritmo de aprendizaje no supervisado?

¿El aprendizaje automático es solo una forma de predecir con precisión resultados particulares y / o tomar acciones óptimas basadas en algún conjunto de datos?

¿Cuáles son las buenas heurísticas para elegir el tamaño de un lote en el entrenamiento de la red neuronal?

¿Por qué no es una práctica estándar publicar pesos de modelos entrenados junto con el código fuente para trabajos de investigación de aprendizaje profundo?

En problemas de optimización matemática, a menudo se usa la primera derivada. ¿Por qué no el segundo, o derivados de orden superior?