¿Cuál es la diferencia entre Deconvolución, Upsampling, Unpooling y Convolutional Sparse Coding?

El muestreo ascendente se refiere a cualquier técnica que, bueno, muestrea su imagen a una resolución más alta.

La forma más fácil es usar remuestreo e interpolación . Esto es tomar una imagen de entrada, redimensionarla al tamaño deseado y luego calcular los valores de píxeles en cada punto utilizando un método de interpolación como la interpolación bilineal.

La descompresión se usa comúnmente en el contexto de redes neuronales convolucionales para denotar la agrupación máxima inversa. Citando de este documento: Unpooling: en el convnet, la operación de agrupación máxima no es invertible, sin embargo, podemos obtener un inverso aproximado registrando las ubicaciones de los máximos dentro de cada región de agrupación en un conjunto de variables de conmutación. En la descontaminación, la operación de desenrollado utiliza estos interruptores para colocar las reconstrucciones desde la capa superior en ubicaciones apropiadas, preservando la estructura del estímulo.

Desconvolución en el contexto de redes neuronales convolucionales a menudo se usa para denotar una especie de convolución inversa, que de manera importante y confusa no es en realidad una deconvolución matemática adecuada . En contraste con el desbobinado, con el uso de ‘deconvolución’ se puede aprender el muestreo ascendente de una imagen. A menudo se usa para aumentar el muestreo de la salida de una conexión a la resolución de imagen original. Escribí otra respuesta sobre este tema aquí. La deconvolución también se conoce más apropiadamente como convolución con zancadas fraccionales, o convolución de transposición.

Luego hay una deconvolución adecuada que revierte el efecto de una convolución (Deconvolución – Wikipedia). No creo que la gente realmente use esto en el contexto de redes neuronales convolucionales.

No sé mucho sobre la codificación dispersa convolucional, pero me parece que al mirar algunos documentos, esos enfoques utilizan el antiguo tipo de ‘deconvolución’, es decir, transvolución de convolución, para permitirle pasar de una representación de imagen dispersa obtenida usando convnets, de vuelta a la resolución de imagen original. (Feliz de ser corregido en esto).

La salida y la entrada de la red FCN / deconvolucional son del mismo tamaño, el objetivo de FCN o red / codificador automático deconvolucional en el etiquetado de píxeles es crear un mapa de características densas en píxeles. La salida de la capa de desagrupamiento (también conocido como muestreo ascendente, a menudo se realiza mediante el método que ha mencionado) se ampliará pero dispersa mapas de características, las siguientes capas de desconvolución luego densificarán estos mapas de características a través de operaciones de convolución con múltiples filtros entrenables.

Espero que responda tu pregunta.

Esto puede ayudar hasta cierto punto:

vdumoulin / conv_arithmetic

¡No tiene todo lo que ha pedido, aún así es una buena visualización para entender cosas!

Aclamaciones,
Duro

More Interesting

¿Cuáles son algunos proyectos interesantes del último año relacionados con el aprendizaje automático?

¿Cuáles son las principales similitudes y diferencias entre los alumnos basados ​​en instancias y las máquinas de vectores de soporte?

Como ingeniero de ASIC, ¿cómo debo prepararme para la era del aprendizaje automático?

¿Existe algún método de aprendizaje profundo aplicado a la economía?

¿Cuáles son las ventajas y desventajas de cada método de regresión no lineal existente?

¿Cuáles son las ventajas y desventajas de usar Statsmodels sobre Scikit-learn?

Cómo elegir el mejor kit de desarrollador de sistemas integrados para el proyecto My Image Processing y Machine Learning

Desde un punto de vista práctico, ¿por qué es tan importante saber programar en Machine Learning?

¿Es incorrecto si realizo un análisis de opinión en revisiones individuales en lugar de en todas las revisiones a la vez?

Dada una lista de codificadores y sus respectivos conjuntos de fragmentos de código, ¿es posible inferir a partir de un fragmento de código nuevo dado el codificador original?

¿Cuál es la diferencia entre modelos discriminativos y generativos en el contexto de la segmentación de imágenes?

¿Por qué se le da tanta atención a xgboost que al aprendizaje profundo a pesar de su ubicuidad en ganar soluciones de Kaggle?

¿Qué es un modelo oculto de Markov - Red neuronal artificial (HMM-ANN)?

¿Es factible hacer una regresión logística en conjuntos de datos con miles de características sin usar una computadora de clúster? ¿Qué tal decenas de miles?

¿Cuál es el mejor lenguaje de programación para implementar algoritmos de aprendizaje automático?