Comencemos con los conjuntos de datos que se usaron en I. Artículo de Goodfellow sobre GAN https://arxiv.org/pdf/1406.2661.pdf:
Donde: a) MNIST , b) TFD , c) CIFAR-10 (modelo totalmente conectado) yd) CIFAR-10 (discriminador convolucional y generador “deconvolucional”).
- ¿Cómo se entrenan las redes estocásticas generativas?
- ¿En qué condiciones funcionaría un algoritmo lento más rápido que un algoritmo rápido?
- ¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?
- ¿Cómo es tomar CS 228: modelo gráfico probabilístico en Stanford?
- ¿Dónde puedo obtener más información sobre la persona en el MIT Media Lab que está trabajando para eliminar el sesgo en el aprendizaje automático?
- La base de datos MNIST de dígitos escritos a mano, disponible en esta página, tiene un conjunto de capacitación de 60,000 ejemplos y un conjunto de prueba de 10,000 ejemplos.
- Toronto Facial Dataset (TFD) es un conjunto de datos de 32 × 32 imágenes en escala de grises (probablemente contiene 2.925 imágenes etiquetadas para capacitación y validación). No es tarea fácil obtener acceso a este conjunto de datos, ya que puede contener datos privados o algo así.
- El conjunto de datos CIFAR-10 consta de 60,000 imágenes en color 32 × 32 en 10 clases, con 6,000 imágenes por clase. Hay 50,000 imágenes de entrenamiento y 10,000 imágenes de prueba.
También hay un artículo sobre “Síntesis generativa de texto adverso a imagen” https://arxiv.org/pdf/1605.05396…:
Utilizaron los siguientes conjuntos de datos:
- Caltech-UCSD Birds es un conjunto de datos de imágenes con fotos de 200 especies de aves. El número total de imágenes es 6.033 .
- Conjunto de datos Oxford-102 Flowers consta de 102 categorías de flores con un número entre 40 y 258 imágenes por categoría.
Espero que ayude a descubrir la cantidad de imágenes para entrenar bien sus GAN s