¿Puede la operación de agrupamiento aumentar el número de neuronas en el aprendizaje profundo?

¡Pregunta apropiada para entender las redes neuronales de convolución (CNN)!

En realidad, las capas de convolución se configuran de manera diferente que las capas completamente conectadas. Los números (64, .., 256) escritos junto a “convolución 3X3” no son la cantidad de neuronas, pero sí la cantidad de filtros utilizados en esa capa.

Las CNN están inspiradas biológicamente en ANN, que funciona principalmente para ocho propiedades:

  1. Conexión local (filtro)
  2. Compartir pesas
  3. Muchos filtros por capa (volumen 3D de neurona)
  4. Muchas capas
  5. Agrupación
  6. Activación no lineal (ReLU)
  7. Capa completamente conectada
  8. Capa de pérdida (softmax)

Los hiperparámetros libres importantes que se muestran en la figura son:

  1. Número de filtro en la capa de convolución
  2. Forma del filtro
  3. Forma de la capa de agrupación
  4. Número de neuronas en capas completamente conectadas y de pérdida.

Red neuronal convolucional

CS231n Redes neuronales convolucionales para reconocimiento visual

Redes neuronales convolucionales (LeNet)

Tutorial de aprendizaje de características y aprendizaje profundo sin supervisión

Soy el interrogador Ahora me he dado cuenta de que cometí un error. ¡Es que pensé que el número de neuronas (unidades de cálculo) era del tamaño de los mapas de características! Por favor, perdóname porque soy un principiante. Ahora sé que la cantidad de neuronas y el tamaño de los mapas de características son dos parámetros diferentes.

La operación de agrupación puede disminuir el tamaño de los mapas de características, pero no tiene nada que ver con la cantidad de neuronas.

Gracias por las respuestas!

Creo que las “unidades” se refieren a mapas de características. Por lo tanto, duplican el número de mapas de características después de la agrupación y la operación de agrupación en sí misma no tiene nada que ver con eso. La idea es reducir el tamaño del mapa espacial al tiempo que se tienen más mapas de características que pueden dar ricas representaciones jerárquicas.