¿Por qué los entrenamientos CNN desequilibrados afectan tanto la clasificación?

Debido a que las redes neuronales (y los modelos de aprendizaje automático en general) extrapolan una regla de clasificación del conjunto de entrenamiento que tienen como si fuera una muestra representativa de su universo.

Por lo tanto, si tienes:

  • 51% tipo A
  • 34% tipo B
  • 15% tipo C

Entonces el modelo “aprenderá” que hay una mayor probabilidad de que un ejemplo sea A que C.

Dependiendo de lo que esté haciendo, esto puede ser un problema obviamente. Para solucionarlo, puede:

  • Encuentre más ejemplos de tipo C y agréguelos al conjunto de entrenamiento.
  • Agregue duplicados de tipo C en su conjunto de entrenamiento.
  • Cree sus lotes (suponiendo que está entrenando con lotes) con sus propias proporciones.

Pero antes de intentarlo, debe preguntarse si el conjunto de entrenamiento realmente debe ser equilibrado.

Hola edoardo

Muchas gracias por tu respuesta detallada.

Aún no lo entiendo. Los filtros aprenden las características de las imágenes. Las características (o una aproximación estadística genérica de ellas) existen o no. ¿Cómo aprende la red las estadísticas de los datos?

Apreciará mucho más aclaraciones.