Cómo interpretar una capa totalmente conectada como una capa convolucional para hacer predicciones densas de píxeles

Puedes ver la secta. 3.1 o Figura 2 en el siguiente documento para más detalles:

[1411.4038] Redes totalmente convolucionales para la segmentación semántica

Pero en resumen, puede pensar en una neurona FC como un filtro convolucional cuyo campo receptivo comprende toda la imagen de entrada, ¡porque una neurona FC produce exactamente un número! Entonces, uno podría pensar en las neuronas de la capa N FC como N “filtros convolucionales” cuyos mapas de activación son de tamaño 1 × 1. Por lo tanto, AlexNet, que toma un parche de imagen de 227x227x3, y produce un mapa de activación 1x1xN desde su primera capa FC, se puede aplicar a una imagen grande (como 640x480x3) para obtener un mapa de activación (mayor que 1 × 1, efectivamente al aplicar cada ¡Neurona FC en forma de ventana deslizante al igual que se aplican filtros convolucionales) de la capa FC para cada neurona!

Si te entiendo correctamente, no puedes realmente. Sin embargo, lo que puede hacer es mantener la red capacitada, eliminar las capas finales, reemplazarlas con capas convolucionales para hacer una red completamente convolucional (FCN) y volver a entrenar la red en mapas de calor. La capacitación es bastante corta ya que la mayoría de la red ya está capacitada para extraer funciones adecuadas a su problema. Ya he hecho algo similar, funciona muy bien. Aquí está la referencia principal sobre la técnica: [1411.4038] Redes totalmente convolucionales para la segmentación semántica

More Interesting

¿Cómo puedo explicar que las unidades tradicionales de red neuronal recurrente (RNN) sufren el problema del gradiente de fuga?

Cómo crear un motor de búsqueda médica utilizando el aprendizaje automático en Java

¿Qué es una explicación intuitiva de la iteración de valores en el aprendizaje por refuerzo (RL)?

¿Cuáles son los libros de texto clásicos y de lectura obligatoria en las estadísticas?

¿Por qué la máquina de Bolzmann restringida se llama memoria asociativa?

¿Cuáles son algunos buenos recursos para aprender sobre el control y la optimización de procesos sin modelos?

¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?

¿Cómo funciona Hidden Markov compatible con Vector Machine?

¿Cuáles son las formas en que puede aplicar la máquina o el aprendizaje profundo al pirateo?

En los algoritmos de aprendizaje automático, ¿por qué la función sigmoidea se usa principalmente y no funciones como tanh (x)? En tanhx por ej. parece dividir el eje y de manera uniforme y aplanarse rápidamente a medida que x se aproxima a +/- infinito. El rango es: sigmoide [0-1] y tanh (x) [-1,1].

¿Qué es la precisión?

¿Cuáles son las diferencias entre el aprendizaje automático y los programas de posgrado en ciencias de datos?

¿Cuál es el mejor software de reconocimiento facial en el mercado?

¿Cuál es la función [math] \ Psi [/ math] en esta diapositiva?

¿Cuál es la relación entre la teoría de la Gestalt y el aprendizaje profundo?