Cómo configurar las dimensiones de la capa y la conectividad en Caffe para reproducir una CNN a partir de un trabajo de investigación

Esta página en el sitio web de Caffe tiene una explicación detallada sobre las capas y los parámetros asociados con cada capa: Caffe | LeNet MNIST Tutorial

num_output determina el número de salidas que produce la capa.

kernel_size determina las dimensiones de cada uno de los filtros de una capa en particular.

¿Cuándo debo aprender tensorflow?
¿Es posible usar el servicio de reconocimiento facial de Facebook desde su API?
Quiero comenzar en PNL. ¿Vale la pena?
¿Cuáles son actualmente los temas candentes en la investigación de aprendizaje automático y en aplicaciones reales?
¿Qué tipo de modelos o técnicas de aprendizaje automático deberían usarse en los datos de la marca de tiempo del lote (por ejemplo, temperatura durante 2 horas)?

Las conexiones, la entrada de una capa y la salida de una capa, están determinadas por los parámetros top e bottom . Estos toman el valor de los names de capa, que son variables.

Esto debería ser suficiente para comenzar. La mayoría de las CNN tienen el mismo diseño, de tener unas pocas capas conv, a cada capa conv seguida de una no linealidad como ReLU o tanh. Las excepciones son la red de inicio y la ResNet más reciente.

En Caffe, la definición de la red se realiza escribiendo el ‘train_val.prototxt’ https://github.com/BVLC/caffe/bl…

Aprendizaje automáticoRedes neuronales artificiales

¿Cuáles son las principales empresas que trabajan en Deep Reinforcement Learning aparte de DeepMind y OpenAI?

¿De qué trata el proyecto de aprendizaje profundo de Google / Google Brain?

¿Existe un libro de aprendizaje automático que ofrece una guía paso a paso con números reales o ejemplos numéricos en algoritmos de aprendizaje automático?

¿Por qué se usa Python para el aprendizaje profundo si es tan lento?

¿Cuál es la ubicación final del trabajo en Power Grid (PGCIL)?

¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

Capa de convolución; configura el tamaño del núcleo, el paso, el relleno y el número de salidas. Por ejemplo, tiene una entrada de 3 luces para imágenes con un tamaño de D x N x N. Después de pasar la capa conv, cambió a T x MXM. el tamaño del núcleo, el paso y el relleno son sobre la transformación N-> M, el número de salida es sobre D -> T.

Capa de agrupación; no afecta a la primera dimensión, solo se trata del cambio N-> M.

Relu, Tanh, Sigmoide; son solo funciones de activación, por lo que el tamaño no cambiará.

Producto Interno ; Usted establece el número de salidas. Cuando un dato de tamaño a * b * c viene con todos los valores conectados a una capa completamente conectada que tiene una dimensión del número de salidas. Entonces el tamaño se cambia como; a * b * c -> número de salida.

Realmente debería leer el documento a continuación, se explica todo en detalles. No se trata de Caffe sino de CNN. Y después de aprender los conceptos básicos, puede comprender fácilmente lo que sucede en .prototxts de caffe.

CS231n Redes neuronales convolucionales para reconocimiento visual

Mehmet Aygün

More Interesting

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

¿Dónde usamos las matemáticas discretas y la probabilidad en informática?

¿Cuáles son los mejores cursos o referencias para la probabilidad de aprendizaje y las estadísticas para el aprendizaje automático?

¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?

Como cuerpo técnico, ¿cómo se concilia el hecho de estar basado en datos, abrazar la diversidad de la fuerza laboral y contratar a los mejores?

¿Cuáles son los avances más significativos del aprendizaje automático en 2017?

¿Cuáles son los tipos de máquina?

Cómo construir y trazar una gráfica de vecinos más cercanos