¿Cuántas imágenes necesito para entrenar una red neuronal convolucional?

Es difícil responder a esta pregunta, porque la cantidad de datos requerida depende de muchas cosas:

  • ¿Es una red de clasificación? Cuantas clases hay? Más clases hacen que el problema en general sea más difícil y se requieren más muestras.
  • ¿Cuál es la resolución de la imagen de entrada? Las resoluciones más altas a menudo requieren más imágenes de entrada.
  • ¿Qué tipo de objetos hay en la entrada? (es mucho más fácil diferenciar entre rectángulos y círculos que entre perros y gatos).
  • ¿Es posible duplicar / estirar / etc. imágenes de entrada? Estos trucos le permiten aumentar el tamaño de su conjunto de datos y, por lo tanto, es posible que necesite registros de datos menos reales.

Ya vi proyectos (reales) con solo alrededor de 4.000 imágenes (= muestras) para CNN, pero las tareas difíciles (como la clasificación de ImageNet) pueden requerir muchas más imágenes. Por lo tanto, depende mucho de la tarea. Pero al menos unos pocos miles (> 10′000) de imágenes deberían estar disponibles para que la tarea no sea demasiado difícil.

En general, no solo la cantidad de datos es importante, sino también su calidad.

Si proporciona más detalles sobre su tarea, puede ser más fácil responder a su pregunta más detalladamente.

Estoy de acuerdo con los puntos que se detallan a continuación. Es imposible sugerir un número exacto sin más contexto en la tarea y el alcance de la misma.

Ciertamente, si está realizando una tarea de clasificación, cuantas más imágenes por clase tenga, mejor. Si también desea evitar el sesgo, también es importante garantizar una distribución uniforme de las imágenes entre las clases. Un punto que creo que es importante es entender qué características distintivas podrían ser más importantes. Por ejemplo, si está buscando clasificar perros y obtener una serie de imágenes de labradores en parques y bulldogs en la calle para identificar estas 2 razas. Puede sesgar el algoritmo para pensar que todos los bulldogs siempre están en una calle y todos los labradores siempre están en los parques. Si, en cambio, mantiene la raza constante para cada clase, pero varía otros factores de manera uniforme (por ejemplo, un número igual de imágenes de labrador en parques y en la calle y del mismo modo para bulldogs), tiene una mejor oportunidad de crear un algoritmo más preciso.

La calidad y la cantidad van de la mano aquí y, aunque se prefiere más calidad y cantidad, dependiendo de su tarea, el nivel mínimo de cada una puede variar.

¡Espero que esto ayude!

More Interesting

¿Tener un conocimiento profundo del aprendizaje por refuerzo cambia su perspectiva hacia la vida? ¿Cómo?

¿Cuál es la mejor manera de normalizar los datos implícitos para un sistema de recomendación de música mediante el filtrado colaborativo?

Cómo crear una representación jerárquica de un conjunto de objetos usando una red neuronal

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

Cómo depurar sus proyectos de ciencia de datos y aprendizaje automático

¿Cuál es la diferencia entre TensorFlow y TensorFlow lite?

En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?

La minería de datos es una versión más fuerte de ajuste de curvas, ¿es correcta?

¿Le resulta aburrido resolver los problemas de aprendizaje automático tipo kaggle intelectualmente aburrido (en comparación con la programación competitiva, por ejemplo)?

¿Cuáles son las diferencias entre los algoritmos CHAID y CART para el crecimiento de los árboles de decisión?

¿Qué debo usar para el aprendizaje automático si necesito una solución rápida: Python, R o SAS?

¿Por qué la necesidad de depuración aún no se ha resuelto después de tantos desarrollos en tecnología, informática, algoritmos y aprendizaje automático?

Si quiero trabajar en Machine Learning e Inteligencia artificial, ¿debería especializarme en Matemáticas / CS o Estadísticas / CS?

¿Por qué la máquina de Bolzmann restringida se llama memoria asociativa?