¿Por qué los entrenamientos CNN desequilibrados afectan tanto la clasificación?

Debido a que las redes neuronales (y los modelos de aprendizaje automático en general) extrapolan una regla de clasificación del conjunto de entrenamiento que tienen como si fuera una muestra representativa de su universo.

Por lo tanto, si tienes:

51% tipo A
34% tipo B
15% tipo C

Entonces el modelo “aprenderá” que hay una mayor probabilidad de que un ejemplo sea A que C.

¿Por qué usamos convolución en redes neuronales?
¿El submuestreo de un entrenamiento desequilibrado es una buena idea cuando los datos del mundo real, usaré mi clasificador, también estarán desequilibrados?
Cómo aprender el aprendizaje automático desde el nivel cero
¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?
Si hoy existiera una computadora cuántica, ¿qué pasaría con la IA / aprendizaje automático / aprendizaje profundo? ¿En qué se traduciría esto para las empresas / industrias?

Dependiendo de lo que esté haciendo, esto puede ser un problema obviamente. Para solucionarlo, puede:

Encuentre más ejemplos de tipo C y agréguelos al conjunto de entrenamiento.
Agregue duplicados de tipo C en su conjunto de entrenamiento.
Cree sus lotes (suponiendo que está entrenando con lotes) con sus propias proporciones.

Pero antes de intentarlo, debe preguntarse si el conjunto de entrenamiento realmente debe ser equilibrado.

AprendizajeAprendizaje automáticoAprendizaje profundoClasificaciónRedes neuronales convolucionales

¿Aprender Python en lugar de C ++ es una buena introducción a los lenguajes de programación en medio de la teoría CS / AI?

¿El aprendizaje automático es malo para la economía?

¿Cómo puedo ejecutar una regresión lineal en paralelo?

¿Cuál es la diferencia entre el aprendizaje automático y la forma en que Kepler obtuvo las leyes de Kepler?

¿Cuál es la mejor manera de analizar y predecir en base a un conjunto de datos que tiene texto y números?

Cómo optimizar una red neuronal convolucional para hacer una clasificación de imágenes

Hola edoardo

Muchas gracias por tu respuesta detallada.

Aún no lo entiendo. Los filtros aprenden las características de las imágenes. Las características (o una aproximación estadística genérica de ellas) existen o no. ¿Cómo aprende la red las estadísticas de los datos?

Apreciará mucho más aclaraciones.

Édouard Belval

More Interesting

¿Debo aplicar PCA antes o después de la selección de funciones?

RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?

¿Qué campos de la robótica tienen mucho espacio para la investigación (mucho antes de la madurez)?

¿Qué es una red neuronal bayesiana?

¿Cuál es la diferencia entre CNN y RNN?

¿Cuáles serán los 3 principales problemas de aprendizaje profundo en los próximos 5 años?

¿Es razonable excluir valores atípicos en su conjunto de datos de entrenamiento para su clasificador?

¿Es cierto que las predicciones en el espacio de alta dimensión son más difíciles en torno al origen?

¿Cuáles son los parámetros del procesamiento del lenguaje natural?