En su forma más pura [1], que no ha tenido mucho éxito, es una red (con capas apiladas, similar a las redes neuronales convolucionales) que aprende alternativamente un conjunto de máscaras de filtro y un conjunto de matrices de activación cuya convolución sería igual a un parche de imagen dado. Se llama operación “deconvolucional” porque está haciendo lo contrario de una operación de “convolución”. En lugar de convolucionar una máscara de filtro con una imagen, para obtener un conjunto de activaciones como en una red neuronal convolucional, estamos tratando de adivinar / inferir las activaciones que, cuando se enreda con la máscara de filtro, producirían la imagen.
El objetivo original era aprender una jerarquía de características de manera no supervisada. Sin embargo, ahora se usa más comúnmente para invertir la disminución de resolución que tiene lugar en una red convolucional y “expandir” la imagen a su tamaño original [2]. Básicamente, enganchando un montón de capas desconvolucionales y capas de “desagrupación”, usando interruptores en las capas de agrupación en la parte convolucional de la red que almacenan cuáles de los cuatro parches espaciales que entraron en la función de agrupación sobrevivieron; y luego ejecutar el descenso de gradiente permite funciones de aprendizaje que no se pueden aprender con una red convolucional pura, por ejemplo, para la segmentación semántica [3].
[1] https://www.cs.nyu.edu/~fergus/p…
- ¿Está bien usar software como scikit learn, tensorflow, keras y desarrollar aplicaciones sin profundizar en los conceptos matemáticos?
- ¿El aprendizaje automático es un comienzo de invasión de estadísticas?
- ¿Qué hace la capa en línea y la capa de línea cercana del sistema Netflix para recomendación?
- Para evaluar qué tan bueno es un hiperparámetro de red (por ejemplo, la tasa de deserción), ¿debo esperar a la convergencia?
- ¿La correlación entre dos variables cuenta como evidencia débil de un vínculo causal entre ellas?
[2] http://arxiv.org/pdf/1311.2901
[3] http://www.cv-foundation.org/ope…
El siguiente hilo de Quora habla más sobre este último uso de capas deconvolucionales:
¿Cómo funciona una red neuronal deconvolucional?