¿Cuál es el beneficio de utilizar la agrupación promedio en lugar de la agrupación máxima?

¿Por qué realizamos la agrupación? Respuesta: Para reducir la varianza, reduzca la complejidad del cálculo (ya que la agrupación máxima de 2 * 2 / agrupación promedio reduce el 75% de los datos) y extraiga las características de bajo nivel del vecindario. Creo que todas estas descripciones se adaptan mejor a la agrupación máxima. ¿No es así?

Echemos un vistazo a esta imagen:

¿Cuáles son los requisitos previos para aprender Machine Learning?
¿Cuáles son las desventajas y desventajas de usar el aprendizaje profundo?
¿Por qué un algoritmo evolutivo es un método inapropiado para usar cuando se busca una clave para descifrar un mensaje codificado cuando solo hay una respuesta correcta?
¿La variable de tiempo muestra una conexión recurrente en RNN?
¿Cuál es el objetivo de la detección de fraude con tarjeta de crédito?

La agrupación máxima extrae las características más importantes, como los bordes, mientras que la agrupación promedio extrae características de manera tan fluida. Para datos de imagen, puede ver la diferencia. Aunque ambos se usan por la misma razón, creo que la agrupación máxima es mejor para extraer las características extremas. La agrupación promedio a veces no puede extraer buenas características porque tiene todo en cuenta y da como resultado un valor promedio que puede o no ser importante para las tareas de tipo de detección de objetos.

Tenga en cuenta aquí, la agrupación promedio lo cuenta todo y lo fluye a la siguiente capa, lo que significa que todos los valores se usan realmente para la asignación de características y la creación de resultados, que es un cálculo muy generalizado. Si no necesita todas las entradas de la capa Conv, obtendrá una mala precisión para la agrupación promedio.

Pero, por supuesto, hay muchas tareas de clasificación en github donde se ha utilizado la agrupación promedio y se superó la agrupación máxima (aunque no estoy seguro de que esto se deba al uso de la agrupación promedio). Entonces, nuevamente, depende del tipo de conjunto de datos (básicamente estoy tomando imágenes y su densidad de píxeles).

Entonces, para responder a su pregunta, no creo que la agrupación promedio tenga una ventaja significativa sobre la agrupación máxima. Pero, puede ser en algunos casos, donde la variación en un filtro de grupo máximo no es significativa, ambos grupos darán resultados del mismo tipo. Pero en casos extremos, la agrupación máxima proporcionará mejores resultados con seguridad.

Agregado, con la agrupación de abandono, todo esto no importa mucho, ya que las capas de abandono pueden desaparecer en cualquier bloque. Nunca he visto ningún trabajo de investigación significativo para comparar entre capas de agrupación. Pero, podría haber algunos. Puede buscar, leer y aprender mejor. La mejor de las suertes.

Gracias.

Aprendizaje automáticoAprendizaje profundoRedes neuronales convolucionales