Cómo configurar las dimensiones de la capa y la conectividad en Caffe para reproducir una CNN a partir de un trabajo de investigación

Esta página en el sitio web de Caffe tiene una explicación detallada sobre las capas y los parámetros asociados con cada capa: Caffe | LeNet MNIST Tutorial

num_output determina el número de salidas que produce la capa.

kernel_size determina las dimensiones de cada uno de los filtros de una capa en particular.

Las conexiones, la entrada de una capa y la salida de una capa, están determinadas por los parámetros top e bottom . Estos toman el valor de los names de capa, que son variables.

Esto debería ser suficiente para comenzar. La mayoría de las CNN tienen el mismo diseño, de tener unas pocas capas conv, a cada capa conv seguida de una no linealidad como ReLU o tanh. Las excepciones son la red de inicio y la ResNet más reciente.

En Caffe, la definición de la red se realiza escribiendo el ‘train_val.prototxt’ https://github.com/BVLC/caffe/bl…

Capa de convolución; configura el tamaño del núcleo, el paso, el relleno y el número de salidas. Por ejemplo, tiene una entrada de 3 luces para imágenes con un tamaño de D x N x N. Después de pasar la capa conv, cambió a T x MXM. el tamaño del núcleo, el paso y el relleno son sobre la transformación N-> M, el número de salida es sobre D -> T.

Capa de agrupación; no afecta a la primera dimensión, solo se trata del cambio N-> M.

Relu, Tanh, Sigmoide; son solo funciones de activación, por lo que el tamaño no cambiará.

Producto Interno ; Usted establece el número de salidas. Cuando un dato de tamaño a * b * c viene con todos los valores conectados a una capa completamente conectada que tiene una dimensión del número de salidas. Entonces el tamaño se cambia como; a * b * c -> número de salida.

Realmente debería leer el documento a continuación, se explica todo en detalles. No se trata de Caffe sino de CNN. Y después de aprender los conceptos básicos, puede comprender fácilmente lo que sucede en .prototxts de caffe.

CS231n Redes neuronales convolucionales para reconocimiento visual

More Interesting

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

¿Dónde usamos las matemáticas discretas y la probabilidad en informática?

¿Cuáles son los mejores cursos o referencias para la probabilidad de aprendizaje y las estadísticas para el aprendizaje automático?

¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?

Como cuerpo técnico, ¿cómo se concilia el hecho de estar basado en datos, abrazar la diversidad de la fuerza laboral y contratar a los mejores?

¿Cuáles son los avances más significativos del aprendizaje automático en 2017?

¿Cuáles son los tipos de máquina?

Cómo construir y trazar una gráfica de vecinos más cercanos

El aprendizaje profundo hará que los humanos sean innecesarios para qué trabajos.

¿Es posible usar 'Mínimo cuadrado (LS)' como la función objetivo cuando se trata con un problema de clasificación?

¿El recocido simulado y la optimización de colonias de hormigas cuentan como aprendizaje automático?

¿Cuándo debe usarse el bosque aleatorio sobre la regresión logística para la clasificación y viceversa?

¿Dónde puedo encontrar modelos de temas previamente capacitados para MALLET?

¿Hay alguna prueba de que no hay una solución algebraica para ajustar las redes neuronales con una (o más) capa (s) oculta (s)?