Cómo implementar una capa de deconvolución con los mismos valores de peso de la capa de convolución anterior para una red neuronal convolucional

Estoy un poco confundido por la diferencia entre convolución y correlación. Entonces no entiendo la respuesta de Charles. Así es como obtengo mi comprensión intuitiva:

Es un poco como autoencoder. En el pase de codificación, usted hace coincidir un conjunto de plantillas (el vector de peso de cada neurona de nivel superior) con la entrada y obtiene un puntaje de coincidencia para cada plantilla (producto de puntos). En el pase de decodificación, se superponen esas plantillas, cada una de las cuales tiene una intensidad igual a la puntuación igualada previamente.

En álgebra lineal, es como usar una matriz ortonormal para proyectar un punto de un espacio a otro, y luego proyectarlo de regreso al espacio original usando su inversa / transposición. Con autoencoders y conv-deconv, las cosas ya no son lineales y la restricción de ortonormalidad existe en una forma más suave.

Related Content

¿Cómo podemos hacer csv o dataset textual a partir de imágenes?

¿Qué otras arquitecturas de redes neuronales se han utilizado para reducir las facturas de energía del centro de datos aparte del método de DeepMind?

Cómo hacer un bot que pueda ser entrenado para jugar juegos simples usando Python

¿Qué saben los profesionales del aprendizaje automático y los científicos de datos de la industria sobre el análisis, la probabilidad basada en la teoría de la medida y el álgebra lineal numérica?

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

¿Vale la pena gastar 52000 INR en Apple iPad Air 32 GB wifi y GSM?

¿Cuál es el concepto detrás de esta llamada gratuita?

No creo que tenga la respuesta que espera, y también me interesaría si existe tal método directo.
Sin embargo, implementé esta capa de manera ingenua mientras seguía este artículo: http://people.idsia.ch/~ciresan/ …

Brian Chu

La transposición hermitiana de un filtro (los pesos en su núcleo de convolución) es el “filtro coincidente”, que correlaciona el filtro original con una señal desconocida (la entrada “invertida”) para detectar la presencia / activación del filtro en la señal desconocida .

Brian Chu

Para ser claros, no puedes. No es posible revertir completamente el efecto de una capa convolucional. Pero como dice Charles Moyes, hay un concepto análogo en el procesamiento de señales (que no entiendo completamente) de correlacionar el filtro original con la salida de la capa convolucional para generar una medida de la presencia del filtro.

Brian Chu

¿Por qué no encuentras el filtro apropiado por optimización? Puede usar CVX fácilmente para resolver su problema inverso usando la norma L1 / L2 con cualquier forma de regularización.

Charles Moyes

More Interesting

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?

¿Son buenos los cursos de Machine Learning AZ y Deep Learning AZ de Kirill Eremenko en Udemy?

¿Hay alguna posibilidad de una B.Tech (CS) más fresca en trabajos de aprendizaje automático (ciencia de datos) en Bangalore?

Cómo elegir un tema de tesis doctoral en aprendizaje profundo

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

¿Cuáles son algunos ejemplos de aprendizaje automático en operaciones de computación en la nube?

¿Cuándo debería preferir los algoritmos de aprendizaje profundo a los algoritmos de aprendizaje automático poco profundos?

Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?

¿Qué modo de Anaconda se debe usar para los algoritmos de aprendizaje automático?

¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?

¿Cuál es la mejor arquitectura de red neuronal para procesar video?

¿Cuál es la mejor extracción de características de un conjunto de datos de imágenes?

¿Son todos los problemas de programación cuadrática convexos?

¿Para qué grandes problemas se han utilizado las SVM (Máquinas de vectores de soporte)?

Web Analytics