Cómo guardar los pesos de los datos de entrenamiento de las pruebas MNIST en Tensorflow para uso futuro

Déjame ver si puedo ayudar :).

Intenté imprimir W.eval () para obtener el peso; pero sucede que me proporciona una matriz cero de 784 × 10. ¿Cómo puedo obtener los pesos en forma de matriz o en formato .csv

Solo asegúrese de usar `eval` this en la sesión activa. A continuación, escribí un fragmento para resaltar los conceptos centrales.

Entonces, aquí X e y son matrices NumPy de su conjunto de entrenamiento y etiquetas de clase. En la parte superior, agregué un interruptor `reuse_weights` para alternar entre la reinicialización de los pesos y la inicialización alternativa de los pesos que cargó de los archivos CSV a las variables` weights_` y `biases_`


g = tf.Graph ()
con g.as_default ():
tf_X = tf.convert_to_tensor (valor = X, dtype = tf.float32)
tf_y = tf.convert_to_tensor (valor = y, dtype = tf.float32)

si reuse_weights:
pesos_ = numpy.loadtxt (…)
sesgos_ = numpy.loadtxt (…)
tf_weights_ = tf.Variable (weights_)
tf_biases_ = tf.Variable (sesgos_)
más: # inicializar pesos
tf_weights_ = tf.Variable (tf.truncated_normal ([…])
tf_biases = tf.Variable (tf.zeros ([…]))

train = optimizer.minimize (costo)

init = tf.initialize_all_variables ()
con tf.Session (graph = g) como sess:
sess.run (init)

para e en épocas:
_, c = sess.run ([tren, costo])

# cuando termine, guarde pesos en matrices numpy
weights_ = tf_weights_.eval ()
sesgos_ = tf_biases_.eval ()

# código guardar matrices numpy en CSV
numpy.savetxt (pesos_, …)
numpy.savetxt (sesgos_, …)

Espero que ayude. Por cierto. Prefiero recomendar el uso de la clase `Saver` en lugar de CSV; para eso fue diseñado: guardar y recargar variables 😉 (antes de volver a escribirlo como un artículo completo, tal vez solo consulte la excelente documentación en https://www.tensorflow.org/versions/r0.7/api_docs/python/state_ops .html)

Guárdelo en formato .pb o expórtelo a TensorFlow Serving.

More Interesting

¿En qué se diferencia la investigación de Machine Learning en la academia de la investigación en la industria?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Qué enfoques utilizaron los participantes en Quora ML CodeSprint 2013?

¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?

¿Puedo usar el aprendizaje profundo o ANN para un problema de agrupación como KNN?

¿Por qué Google TensorFlow usa OpenCL y no OpenGL? ¿Cuáles son las ventajas?

¿Es posible darle a una computadora millones de imágenes de varios objetos, y se da cuenta de que hay cosas como animales, platos de cocina, montañas, etc. sin que nosotros lo digamos, y cómo se hace esto exactamente?

¿Las computadoras cuánticas mostrarían una aceleración para el aprendizaje automático?

¿Hay aplicaciones de IA en adquisiciones?

¿Puede LSTM u otro tipo de red neuronal recurrente aprender a extraer y representar un estado de Markov?

Cómo construir un proyecto de aprendizaje profundo en dos meses

¿Cuáles son los mejores cursos de ciencia de datos en Udemy?

¿Cómo se ha desviado Grok Solutions de la visión de Numenta?

¿Cuándo debo usar la agrupación antes de ejecutar un modelo de regresión logística?

¿Cuál es un buen conjunto de datos de Kaggle para practicar el ajuste de modelos de regresión logística o modelos jerárquicos?