¿Puede la operación de agrupamiento aumentar el número de neuronas en el aprendizaje profundo?

¡Pregunta apropiada para entender las redes neuronales de convolución (CNN)!

En realidad, las capas de convolución se configuran de manera diferente que las capas completamente conectadas. Los números (64, .., 256) escritos junto a “convolución 3X3” no son la cantidad de neuronas, pero sí la cantidad de filtros utilizados en esa capa.

Las CNN están inspiradas biológicamente en ANN, que funciona principalmente para ocho propiedades:

Conexión local (filtro)
Compartir pesas
Muchos filtros por capa (volumen 3D de neurona)
Muchas capas
Agrupación
Activación no lineal (ReLU)
Capa completamente conectada
Capa de pérdida (softmax)

Los hiperparámetros libres importantes que se muestran en la figura son:

Número de filtro en la capa de convolución
Forma del filtro
Forma de la capa de agrupación
Número de neuronas en capas completamente conectadas y de pérdida.

Red neuronal convolucional

CS231n Redes neuronales convolucionales para reconocimiento visual

Redes neuronales convolucionales (LeNet)

Tutorial de aprendizaje de características y aprendizaje profundo sin supervisión

¿Por qué decimos que la máquina de vectores de soporte y muchas otras técnicas de aprendizaje automático tienen un supuesto subyacente de iid?

¿Cuáles son sus 5 mejores técnicas empíricas para detectar BS?

¿Qué universidades de la India son buenas para realizar investigaciones en el aprendizaje por refuerzo?

¿Es posible agregar una nueva entrada a la capa totalmente conectada justo antes del softmax en la CNN?

¿Cuáles son algunos trabajos de investigación basados en ciencia de datos y aprendizaje automático en los que R se utiliza como lenguaje de programación?

Cómo construir un automóvil autónomo a partir de un automóvil normal

Soy el interrogador Ahora me he dado cuenta de que cometí un error. ¡Es que pensé que el número de neuronas (unidades de cálculo) era del tamaño de los mapas de características! Por favor, perdóname porque soy un principiante. Ahora sé que la cantidad de neuronas y el tamaño de los mapas de características son dos parámetros diferentes.

La operación de agrupación puede disminuir el tamaño de los mapas de características, pero no tiene nada que ver con la cantidad de neuronas.

Gracias por las respuestas!

Amrit Krishnan

Creo que las “unidades” se refieren a mapas de características. Por lo tanto, duplican el número de mapas de características después de la agrupación y la operación de agrupación en sí misma no tiene nada que ver con eso. La idea es reducir el tamaño del mapa espacial al tiempo que se tienen más mapas de características que pueden dar ricas representaciones jerárquicas.

Debiprasad Ghosh

More Interesting

¿Cuáles son los principales desafíos en el aprendizaje semi-supervisado?

¿Cuáles son las principales aplicaciones potenciales para un cordón neural? ¿Hay algún peligro relacionado con el uso de dicha tecnología?

¿Hay un LSTM en TensorFlow que procesa un carácter a la vez?

¿Cuál es la mejor manera de distribuir el descenso de gradiente?

Cómo implementar el aprendizaje sensible al costo en TensorFlow para penalizar la clasificación errónea en clases minoritarias (los datos tienen un problema de desequilibrio de clase)

¿Qué debo buscar al comprar una computadora para ejecutar experimentos de Machine Learning?

¿Puede ocurrir un sobreajuste en un algoritmo de aprendizaje no supervisado?

¿Cuáles son las aplicaciones del error cuadrático medio?

¿Qué significa decir que dos clasificadores son independientes?

¿Cuál es la diferencia entre las redes de Markov y las redes bayesianas?