¿Qué es una red neuronal deconvolucional?

En su forma más pura [1], que no ha tenido mucho éxito, es una red (con capas apiladas, similar a las redes neuronales convolucionales) que aprende alternativamente un conjunto de máscaras de filtro y un conjunto de matrices de activación cuya convolución sería igual a un parche de imagen dado. Se llama operación “deconvolucional” porque está haciendo lo contrario de una operación de “convolución”. En lugar de convolucionar una máscara de filtro con una imagen, para obtener un conjunto de activaciones como en una red neuronal convolucional, estamos tratando de adivinar / inferir las activaciones que, cuando se enreda con la máscara de filtro, producirían la imagen.

El objetivo original era aprender una jerarquía de características de manera no supervisada. Sin embargo, ahora se usa más comúnmente para invertir la disminución de resolución que tiene lugar en una red convolucional y “expandir” la imagen a su tamaño original [2]. Básicamente, enganchando un montón de capas desconvolucionales y capas de “desagrupación”, usando interruptores en las capas de agrupación en la parte convolucional de la red que almacenan cuáles de los cuatro parches espaciales que entraron en la función de agrupación sobrevivieron; y luego ejecutar el descenso de gradiente permite funciones de aprendizaje que no se pueden aprender con una red convolucional pura, por ejemplo, para la segmentación semántica [3].

[1] https://www.cs.nyu.edu/~fergus/p…

[2] http://arxiv.org/pdf/1311.2901

[3] http://www.cv-foundation.org/ope…

El siguiente hilo de Quora habla más sobre este último uso de capas deconvolucionales:

¿Cómo funciona una red neuronal deconvolucional?

Las redes neuronales intentan simular, o emular, la forma en que funciona el cerebro humano.

La convolución, o deconvolución, son procesos de refinación que tienen que ver con la extrapolación de fechas, en el contexto de la red neuronal.

Este tema es altamente complejo y especializado, esta respuesta es un intento de una respuesta simplificada. El tema se aprende mejor a partir del estudio, la experiencia y la experimentación.

rafe

More Interesting

¿Qué es el Tanimoto Score y cuándo se usa?

¿La normalización de lotes hará la diferencia al entrenar con tamaño de lote = 1?

¿Qué libros o recursos de probabilidad y estadística debo consultar antes de sumergirme en Machine Learning, PNL, minería de datos, etc.? Soy un completo principiante.

Conciencia del contexto: ¿Qué es el descubrimiento de noticias anticipatorio?

¿Tener un conocimiento profundo del aprendizaje por refuerzo cambia su perspectiva hacia la vida? ¿Cómo?

Cómo expresar un modelo de árbol de decisión en modelos gráficos

¿Qué hace que los parámetros del modelo sean variables latentes?

¿Cómo puede un investigador practicar las estadísticas bayesianas sin suficientes conocimientos matemáticos?

¿Está bien usar kNN para este problema de clasificación de símbolos musicales?

AI aprende de los datos del pasado para predecir, entonces, ¿debería haber preocupaciones en torno al pensamiento grupal? ¿La creatividad tendrá éxito en un mundo más autónomo?

Cómo guardar los pesos de los datos de entrenamiento de las pruebas MNIST en Tensorflow para uso futuro

¿Cuáles son algunos documentos académicos de aprendizaje automático notables / influyentes en los últimos 5 años?

¿Qué debo aprender para el aprendizaje automático, C ++ o Python?

¿Cuáles son algunos pequeños proyectos iniciales en aprendizaje automático de regresión lineal que un principiante puede hacer en 2-3 días?

¿Qué es una explicación intuitiva de la diferencia entre equilibrios correlacionados y equilbria correlacionada gruesa?