¿Cómo creo un conjunto de datos como MNIST para reconocer caracteres de otro idioma? Tengo un conjunto de datos como una carpeta de imágenes. ¿Cómo uso eso en Tensorflow?

Puede usar ImageDataGenerator de Keras (biblioteca de aprendizaje profundo de alto nivel construida sobre Tensorflow). Tienes que almacenar cada clase en carpetas separadas:

imágenes / tren / c0
imágenes / tren / c1

images / test / c0
imágenes / prueba / c1

Este generador de lotes es fácil de usar. Y puede agregar muchos métodos de aumento de datos (realizados sobre la marcha):

  from keras.preprocessing.image import ImageDataGenerator

 datagen = ImageDataGenerator (
        	 reescalar = 1. / 255,
        	 shear_range = 0.2,
        	 zoom_range = 0.2,
        	 horizontal_flip = True)

 train_generator = datagen.flow_from_directory (
        	 'datos / tren',
        	 target_size = (150, 150),
        	 batch_size = 32,
        	 class_mode = 'categórico'

 para ello en rango (NB_ITERATIONS):
	 # obtener un nuevo lote para entrenamiento 
	 # manejar nueva época y barajar 
	 lote_x, lote_y = train_generator.next ()

	 _ = sess.run ([train_op, precisión], feed = {x: batch_x, y: batch_y})
	 # agregar un generador_prueba? 

[Código fuente] (fchollet / keras) es fácil de entender.
Para que pueda ajustarlo, para agregar nuevos métodos de aumento de datos (específicos para su dominio). O puede agregar archivos de entrada más complejos (HDF5, LMDB, …) con E / S paralelas rápidas.

More Interesting

¿Es posible o valioso obtener otro doctorado en Machine Learning (Deep Learning) de una de las 50 mejores universidades de los Estados Unidos?

¿Qué recursos sobre modelos gráficos se recomiendan para los estudiantes de aprendizaje automático que desean ingresar al campo?

¿Qué debo hacer para construir una carrera en Machine Learning? ¿Por dónde empiezo y cuáles son mis opciones?

¿Cómo se usan los árboles BSP (partición de espacio binario) en los algoritmos de aprendizaje automático?

¿Cuál es la mejor tarea para las redes neuronales en 2017 y tal vez para los próximos 5 años?

¿Qué es el aprendizaje no supervisado?

¿Qué IIT en India tiene el mejor programa de CS para el aprendizaje automático?

¿Qué campos necesitan NLP (procesamiento del lenguaje natural) o técnicas de minería de texto?

¿Cuáles fueron las principales conclusiones del tutorial de Richard Sutton sobre el aprendizaje por refuerzo en NIPS 2015?

¿Puedo usar videos de YouTube para hacer aprendizaje automático comercial?

¿Cuáles son las diferencias entre hacer aprendizaje automático en la academia y en la industria?

¿Cuál es el ejemplo de código más simple para redes neuronales recurrentes (RNN) en TensorFlow?

¿Podemos usar el modelo oculto de Markov para inferir las variables ocultas del universo?

¿Cómo seleccionaría los datos para capacitar y probar los modelos?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?