La capa de agrupación máxima reduce la entrada al mantener la activación máxima en una ventana determinada (generalmente una ventana de 2 × 2 con zancada 2). Si el núcleo de la capa de agrupación máxima es demasiado alto, está arrojando demasiada información valiosa.
Por otro lado, el tamaño del núcleo CNN suele ser mayor, por lo que se ve en una ventana más grande en la imagen. Intente mirar una imagen en ventanas 3 × 3, por lo general no hay suficiente información para sacar conclusiones de lo que hay en la imagen, solo algunos píxeles de colores aleatorios. Pero si comienza a mirar la imagen en una ventana más grande, puede comenzar a ver información sensible: un rostro humano, el volante de un automóvil, una puerta, …
Necesita tamaños de kernel más grandes en CNN para extraer características sensibles de la imagen y kernels de agrupación máxima pequeña para que no deseche información importante.
- ¿Por qué Go es el único juego de mesa en el que los humanos aún pueden vencer a las computadoras de manera confiable?
- ¿Los robots van a conquistar el universo?
- ¿IBM Watson tiene elementos de aprendizaje profundo dentro de su código?
- ¿Cómo es trabajar en Watson Analytics de IBM?
- ¿Cuáles son los éxitos recientes en IA además del aprendizaje profundo?