¿Cuál es el beneficio de utilizar la agrupación promedio en lugar de la agrupación máxima?

¿Por qué realizamos la agrupación? Respuesta: Para reducir la varianza, reduzca la complejidad del cálculo (ya que la agrupación máxima de 2 * 2 / agrupación promedio reduce el 75% de los datos) y extraiga las características de bajo nivel del vecindario. Creo que todas estas descripciones se adaptan mejor a la agrupación máxima. ¿No es así?

Echemos un vistazo a esta imagen:

La agrupación máxima extrae las características más importantes, como los bordes, mientras que la agrupación promedio extrae características de manera tan fluida. Para datos de imagen, puede ver la diferencia. Aunque ambos se usan por la misma razón, creo que la agrupación máxima es mejor para extraer las características extremas. La agrupación promedio a veces no puede extraer buenas características porque tiene todo en cuenta y da como resultado un valor promedio que puede o no ser importante para las tareas de tipo de detección de objetos.

Tenga en cuenta aquí, la agrupación promedio lo cuenta todo y lo fluye a la siguiente capa, lo que significa que todos los valores se usan realmente para la asignación de características y la creación de resultados, que es un cálculo muy generalizado. Si no necesita todas las entradas de la capa Conv, obtendrá una mala precisión para la agrupación promedio.

Pero, por supuesto, hay muchas tareas de clasificación en github donde se ha utilizado la agrupación promedio y se superó la agrupación máxima (aunque no estoy seguro de que esto se deba al uso de la agrupación promedio). Entonces, nuevamente, depende del tipo de conjunto de datos (básicamente estoy tomando imágenes y su densidad de píxeles).

Entonces, para responder a su pregunta, no creo que la agrupación promedio tenga una ventaja significativa sobre la agrupación máxima. Pero, puede ser en algunos casos, donde la variación en un filtro de grupo máximo no es significativa, ambos grupos darán resultados del mismo tipo. Pero en casos extremos, la agrupación máxima proporcionará mejores resultados con seguridad.

Agregado, con la agrupación de abandono, todo esto no importa mucho, ya que las capas de abandono pueden desaparecer en cualquier bloque. Nunca he visto ningún trabajo de investigación significativo para comparar entre capas de agrupación. Pero, podría haber algunos. Puede buscar, leer y aprender mejor. La mejor de las suertes.

Gracias.

Según mi experiencia, la agrupación promedio impide que la red aprenda las estructuras de la imagen, como los bordes y las texturas. Un colega mío aplicó la agrupación promedio al aprendizaje de contraste de imagen y descubrió que la agrupación promedio funcionó significativamente mejor que la agrupación máxima en su caso.

Trataré de ponerlo en palabras simples. Espero que sepan cómo la agrupación promedio y la agrupación máxima son diferentes. En palabras simples, la agrupación máxima rechaza una gran porción de datos y la retiene a un máximo de 1/4. El agrupamiento promedio, por otro lado, no lo rechaza todo y retiene más información, en comparación con el agrupamiento máximo. Esto es lo que generalmente se cree que conduce a mejores resultados. Pero también depende del escenario.

More Interesting

¿Se utiliza Machine Learning fuera de las startups y otras "nuevas" empresas?

Durante la limpieza de datos cuando tiene un número decimal que representa el número de personas, ¿debe redondear hacia arriba o hacia abajo? Además, ¿qué sucede si el número total de todos los números redondeados no coincide con el número total de personas, es un error?

¿Cuáles son los problemas menos resueltos o no resueltos que se pueden resolver con el aprendizaje automático y el aprendizaje profundo?

Cómo tener una buena inicialización de la probabilidad previa, la probabilidad de emisión en los modelos ocultos de Markov ya que los HMM son óptimos locales

¿Qué es el preprocesamiento de audio?

¿Cuáles son las sinergias entre los estudios en Operaciones y Gestión de la Información y Ciencias de la Computación?

Cómo elegir el parámetro C para SVM

¿Qué tan bueno es Irlanda para la visión por computadora?

¿Qué puedo hacer si soy un experto en aprendizaje automático supervisado?

¿Cuál es el lenguaje más cercano al lenguaje de máquina?

¿Cómo se puede utilizar el aprendizaje automático en el análisis de tendencias?

¿Es cierto que las predicciones en el espacio de alta dimensión son más difíciles en torno al origen?

¿Qué tan buenas son mis posibilidades de conseguir un trabajo de científico de datos con un doctorado en el campo de la visión por computadora?

¿Cuáles son las próximas competencias de Kaggle?

¿Cuál es la distribución condicional completa?