¿Podría la red neuronal de convolución completa aprender a discriminar entre clases si no hay muestreo descendente y la entrada es igual a salida?

Esta pregunta fue respondida realmente en el siguiente documento (” Auto-Encoders convolucionales apilados para extracción de características jerárquicas “, Masci et al.).

Uno de sus hallazgos empíricos fue que, sin disminución de muestreo, la red a menudo aprendió soluciones triviales para el problema del autoencoder (que es el problema de aprendizaje cuando la entrada y la salida son las mismas). Esto sería cosas como aprender un mapeo de identidad de entrada a salida. Sin embargo, esto no debería ser demasiado sorprendente cuando lo piensas. Sin disminución de muestreo, no hay una buena razón por la cual la red debería querer aprender representaciones de características robustas para las entradas. Después de todo, la red puede lograr un menor valor de pérdida si solo aprende la identidad.

Comentario final: la disminución de muestras es solo una de las muchas formas de lograr que la red aprenda representaciones sólidas. La idea clave aquí es inyectar ruido para evitar que la red aprenda algo trivial. Entonces, en lugar de reducir el muestreo, también puede inyectar ruido en las entradas y hacer que pronostiquen una versión “limpia” de la entrada. Se sabe que funciona bien para aprender buenas representaciones de características en convnets.

More Interesting

Después de dominar el aprendizaje profundo, ¿es posible conseguir un trabajo en aprendizaje automático?

¿Cómo se pueden utilizar los autoencoders apilados para preentrenar una red neuronal que tiene más neuronas en las capas ocultas que entradas? es posible?

¿El teorema de no almuerzo gratis no es una contradicción al descubrimiento del algoritmo maestro?

¿Qué algoritmo funciona mejor para bandidos adversarios?

Máquinas de factorización: ¿cómo hacen los FM para hacer predicciones y aprender?

¿Cuáles son las suposiciones hechas por los modelos ocultos de Markov?

¿Cuáles son las mejores universidades para estudiar visión artificial con un enfoque en aprendizaje profundo?

¿Cómo trata Apache Spark con los datos de registro que se ejecutan en TeraBytes con memoria limitada (por ejemplo, 8 GB)?

¿Dónde se pueden encontrar nuevos artículos sobre aprendizaje automático y aprendizaje profundo? ¿Hay algún tipo de agregador?

Cómo entrenar una red neuronal con grandes datos

¿Cuándo necesitamos tener un mayor número de unidades ocultas que el número de unidades de entrada y viceversa?

Quiero comenzar en PNL. ¿Vale la pena?

Cómo estructurar sus proyectos de aprendizaje automático

¿Cómo debo elegir entre convertirme en un desarrollador de JavaScript de pila completa o un ingeniero de aprendizaje automático?

¿Cómo puede un estudiante graduado de primer año en ciencias de la computación encontrar un trabajo en minería y análisis de datos después de graduarse?