Es difícil responder a esta pregunta, porque la cantidad de datos requerida depende de muchas cosas:
- ¿Es una red de clasificación? Cuantas clases hay? Más clases hacen que el problema en general sea más difícil y se requieren más muestras.
- ¿Cuál es la resolución de la imagen de entrada? Las resoluciones más altas a menudo requieren más imágenes de entrada.
- ¿Qué tipo de objetos hay en la entrada? (es mucho más fácil diferenciar entre rectángulos y círculos que entre perros y gatos).
- ¿Es posible duplicar / estirar / etc. imágenes de entrada? Estos trucos le permiten aumentar el tamaño de su conjunto de datos y, por lo tanto, es posible que necesite registros de datos menos reales.
Ya vi proyectos (reales) con solo alrededor de 4.000 imágenes (= muestras) para CNN, pero las tareas difíciles (como la clasificación de ImageNet) pueden requerir muchas más imágenes. Por lo tanto, depende mucho de la tarea. Pero al menos unos pocos miles (> 10′000) de imágenes deberían estar disponibles para que la tarea no sea demasiado difícil.
En general, no solo la cantidad de datos es importante, sino también su calidad.
- Andrew Ng: ¿Por qué ya no es necesario entrenar capas a través de codificadores automáticos para Deep Learning?
- ¿Cuáles son las preguntas más importantes en el aprendizaje automático?
- Cómo crear un sistema de predicción de calificación a partir de los comentarios de los revisores para comentarios 360 dados un comentario del revisor y el conjunto de datos de calificación correspondiente
- ¿Cuántos datos son suficientes para entrenar un modelo NN profundo?
- ¿Cuál es el principio del aprendizaje profundo?
Si proporciona más detalles sobre su tarea, puede ser más fácil responder a su pregunta más detalladamente.