Sí, una ventaja de este enfoque en comparación con una capa totalmente conectada es que la red puede tomar entradas de tamaño arbitrario. La agrupación de pirámides espaciales [1] (SPP) es una generalización de esta idea. Una capa SPP tiene un conjunto [matemático] S [/ matemático] de enteros positivos como sus hiperparámetros. Para cada número [math] i [/ math] en este conjunto, divida cada mapa de características en [math] i [/ math] por [math] i [/ math] parches de tamaño aproximadamente igual y aplique una operación de agrupación promedio o máxima. Esta capa produce [math] \ sum \ limits_ {i \ in S} i ^ 2 f [/ math] salidas donde [math] f [/ math] es el número de mapas de características en la capa de convolución de entrada. Una capa de agrupación promedio global es el caso especial de esta capa donde [math] L = \ {1 \} [/ math].
Notas al pie
[1] [1406.4729] Agrupación de pirámides espaciales en redes convolucionales profundas para reconocimiento visual
- Cómo saber si mi modelo de regresión es heteroscedastic u homoscedastic de mi modelo de residuos
- ¿Cuál es la mejor manera de distribuir una aplicación de iOS para un proyecto de investigación?
- ¿Qué tipo de sistema de recomendación usar con datos extremadamente escasos?
- ¿Cuáles son algunas aplicaciones del aprendizaje automático para la ciencia ambiental y la ingeniería ambiental?
- ¿Qué es la regresión no lineal vs regresión lineal?