¿Cuántas imágenes necesito para entrenar una red neuronal convolucional?

Es difícil responder a esta pregunta, porque la cantidad de datos requerida depende de muchas cosas:

¿Es una red de clasificación? Cuantas clases hay? Más clases hacen que el problema en general sea más difícil y se requieren más muestras.
¿Cuál es la resolución de la imagen de entrada? Las resoluciones más altas a menudo requieren más imágenes de entrada.
¿Qué tipo de objetos hay en la entrada? (es mucho más fácil diferenciar entre rectángulos y círculos que entre perros y gatos).
¿Es posible duplicar / estirar / etc. imágenes de entrada? Estos trucos le permiten aumentar el tamaño de su conjunto de datos y, por lo tanto, es posible que necesite registros de datos menos reales.

Ya vi proyectos (reales) con solo alrededor de 4.000 imágenes (= muestras) para CNN, pero las tareas difíciles (como la clasificación de ImageNet) pueden requerir muchas más imágenes. Por lo tanto, depende mucho de la tarea. Pero al menos unos pocos miles (> 10′000) de imágenes deberían estar disponibles para que la tarea no sea demasiado difícil.

En general, no solo la cantidad de datos es importante, sino también su calidad.

Si proporciona más detalles sobre su tarea, puede ser más fácil responder a su pregunta más detalladamente.

Aprendizaje automáticoAprendizaje profundoconvolucionalesRedes neuronalesRedes neuronales artificiales

¿Cuán verdadera es la frase '95% de los sofisticados algoritmos de 'aprendizaje automático' son lanzados a los datos por alguien que solo tiene la comprensión más superficial de lo que realmente están haciendo '?

¿Cuáles son los mejores cursos de ciencia de datos en Udemy?

¿Por qué la búsqueda de imágenes de Google es tan rápida?

¿Cuál es la forma correcta de verificar si mi fórmula de gradiente es correcta o no?

¿Cómo se compara la Ruta 53 de Amazon con el DNS público de Google y OpenDNS?

Cómo construir un sistema de recomendación de itinerario basado en las preferencias del usuario

Estoy de acuerdo con los puntos que se detallan a continuación. Es imposible sugerir un número exacto sin más contexto en la tarea y el alcance de la misma.

Ciertamente, si está realizando una tarea de clasificación, cuantas más imágenes por clase tenga, mejor. Si también desea evitar el sesgo, también es importante garantizar una distribución uniforme de las imágenes entre las clases. Un punto que creo que es importante es entender qué características distintivas podrían ser más importantes. Por ejemplo, si está buscando clasificar perros y obtener una serie de imágenes de labradores en parques y bulldogs en la calle para identificar estas 2 razas. Puede sesgar el algoritmo para pensar que todos los bulldogs siempre están en una calle y todos los labradores siempre están en los parques. Si, en cambio, mantiene la raza constante para cada clase, pero varía otros factores de manera uniforme (por ejemplo, un número igual de imágenes de labrador en parques y en la calle y del mismo modo para bulldogs), tiene una mejor oportunidad de crear un algoritmo más preciso.

La calidad y la cantidad van de la mano aquí y, aunque se prefiere más calidad y cantidad, dependiendo de su tarea, el nivel mínimo de cada una puede variar.

¡Espero que esto ayude!

Benjamin Meier

More Interesting

¿Tener un conocimiento profundo del aprendizaje por refuerzo cambia su perspectiva hacia la vida? ¿Cómo?

¿Cuál es la mejor manera de normalizar los datos implícitos para un sistema de recomendación de música mediante el filtrado colaborativo?

Cómo crear una representación jerárquica de un conjunto de objetos usando una red neuronal

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

Cómo depurar sus proyectos de ciencia de datos y aprendizaje automático

¿Cuál es la diferencia entre TensorFlow y TensorFlow lite?

En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?

La minería de datos es una versión más fuerte de ajuste de curvas, ¿es correcta?