Cómo implementar una capa de deconvolución con los mismos valores de peso de la capa de convolución anterior para una red neuronal convolucional

Estoy un poco confundido por la diferencia entre convolución y correlación. Entonces no entiendo la respuesta de Charles. Así es como obtengo mi comprensión intuitiva:

Es un poco como autoencoder. En el pase de codificación, usted hace coincidir un conjunto de plantillas (el vector de peso de cada neurona de nivel superior) con la entrada y obtiene un puntaje de coincidencia para cada plantilla (producto de puntos). En el pase de decodificación, se superponen esas plantillas, cada una de las cuales tiene una intensidad igual a la puntuación igualada previamente.

En álgebra lineal, es como usar una matriz ortonormal para proyectar un punto de un espacio a otro, y luego proyectarlo de regreso al espacio original usando su inversa / transposición. Con autoencoders y conv-deconv, las cosas ya no son lineales y la restricción de ortonormalidad existe en una forma más suave.

No creo que tenga la respuesta que espera, y también me interesaría si existe tal método directo.
Sin embargo, implementé esta capa de manera ingenua mientras seguía este artículo: http://people.idsia.ch/~ciresan/

La transposición hermitiana de un filtro (los pesos en su núcleo de convolución) es el “filtro coincidente”, que correlaciona el filtro original con una señal desconocida (la entrada “invertida”) para detectar la presencia / activación del filtro en la señal desconocida .

Para ser claros, no puedes. No es posible revertir completamente el efecto de una capa convolucional. Pero como dice Charles Moyes, hay un concepto análogo en el procesamiento de señales (que no entiendo completamente) de correlacionar el filtro original con la salida de la capa convolucional para generar una medida de la presencia del filtro.

¿Por qué no encuentras el filtro apropiado por optimización? Puede usar CVX fácilmente para resolver su problema inverso usando la norma L1 / L2 con cualquier forma de regularización.

More Interesting

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?

¿Son buenos los cursos de Machine Learning AZ y Deep Learning AZ de Kirill Eremenko en Udemy?

¿Hay alguna posibilidad de una B.Tech (CS) más fresca en trabajos de aprendizaje automático (ciencia de datos) en Bangalore?

Cómo elegir un tema de tesis doctoral en aprendizaje profundo

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

¿Cuáles son algunos ejemplos de aprendizaje automático en operaciones de computación en la nube?

¿Cuándo debería preferir los algoritmos de aprendizaje profundo a los algoritmos de aprendizaje automático poco profundos?

Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?

¿Qué modo de Anaconda se debe usar para los algoritmos de aprendizaje automático?

¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?

¿Cuál es la mejor arquitectura de red neuronal para procesar video?

¿Cuál es la mejor extracción de características de un conjunto de datos de imágenes?

¿Son todos los problemas de programación cuadrática convexos?

¿Para qué grandes problemas se han utilizado las SVM (Máquinas de vectores de soporte)?