¿Se pueden usar las redes neuronales para resolver problemas de aprendizaje no supervisados?

Nosotros tenemos:

  • Autoencoders
  • Redes adversas generativas (GAN)

Los codificadores automáticos se basan en modelos de redes neuronales no supervisadas (NN) mediante los cuales tenemos las redes codificador [math] f () [/ math] y decodificador [math] g () [/ math]. El objetivo del autoencoder es aprender características que pueden reconstruir la entrada x, ya que dichos autoencoders se aplican en:

  • Característica de aprendizaje
  • Reducción de dimensionalidad
  • Modelos generativos
  • Reducción de ruido

El codificador codifica la entrada x en un vector de código compacto z:

[matemáticas] z = f (x, w_ {e}) [/ matemáticas]

donde [math] w_ {e} [/ math] = parámetros del codificador

Y el decodificador intenta reconstruir x de z como:

[matemáticas] \ hat {x} = g (z, w_ {d}) [/ matemáticas]

donde [math] w_ {d} [/ math] = parámetros del decodificador

La pérdida es el error de reconstrucción:

[matemáticas] e = || x- \ hat {x} || [/ matemáticas]

Lo que significa que no hay supervisión para optimizar los parámetros. En la mayoría de los casos, también podemos vincular los pesos [matemática] w_ {e} [/ matemática] y [matemática] w_ {d} [/ matemática] porque [matemática] f () [/ matemática] es el inverso de [matemática] ] g () [/ math] y viceversa. Se supone que el código z actúa como un cuello de botella para que el autoencoder aprenda una representación robusta.

Las GAN son otro tipo especial de modelos de aprendizaje sin supervisión que utilizan dos NN, el discriminador y la red generadora. Esto suena similar a los codificadores automáticos. Sí, en realidad tenemos codificadores automáticos adversos generativos. Las GAN son únicas en el sentido de que aplican algún tipo de juego. La red del generador intenta engañar a la red discriminadora generando datos falsos lo más cerca posible de los datos reales, mientras que el discriminador intenta distinguir los falsos de los reales. Así, las GAN aplican la teoría de juegos al proceso de aprendizaje. Las GAN también se pueden aplicar en:

  • Característica de aprendizaje
  • Reducción de dimensionalidad
  • Modelos generativos
  • Reducción de ruido

Por lo tanto, los codificadores automáticos y las GAN son dos modelos populares de NN sin supervisión.

Espero que esto ayude.

Por supuesto, incluso hay arquitecturas de redes neuronales que son solo para el aprendizaje no supervisado.

Imagen:

https://image.slidesharecdn.com/

fuente :

https://www.slideshare.net/milke

Zoológico de arquitecturas de redes neuronales:

http://www.asimovinstitute.org/n

More Interesting

¿Dónde funcionará bien el aprendizaje automático como servicio? ¿Dónde no lo hará?

¿De qué manera las competencias de minería de datos y aprendizaje automático ayudan / restan valor a estos campos académicos y sus aplicaciones comerciales?

¿Cuál es la forma correcta de verificar si mi fórmula de gradiente es correcta o no?

¿Puede ingresar al programa de doctorado CS de nivel superior / siguiente sin publicación, suponiendo que tenga una experiencia de investigación decente?

¿Cuál es la intuición para usar tocones de decisión en el aprendizaje automático?

En una unidad LSTM, ¿cuál es la razón detrás del uso de una activación de tanh?

¿Cuál es la forma óptima de almacenar y cargar un gran conjunto de datos de imágenes?

¿Cuáles son los nuevos modelos de aprendizaje profundo que aparecen en los últimos años?

En Machine Learning: ¿por qué siempre entrenamos una muestra en lugar de todo el conjunto de datos / base de datos?

¿Cuáles son los libros de texto clásicos y de lectura obligatoria en las estadísticas?

¿Cuál es el minimizador de [matemáticas] H [f] = \ sum ^ {N} _ {i = 1} \ | y ^ {(i)} - f (x_i) \ | ^ 2_ {2} + \ lambda \ | Pf \ | ^ 2 [/ math] cuando la salida es un vector?

¿Cuántos 50 mg / ml hay en un vial de 10 ml de EP?

¿Cuáles son las diferencias (y similitudes) en el funcionamiento de una computadora cuántica y una red neuronal artificial?

¿Puede un fármaco ser estadísticamente efectivo para toda la población, pero estadísticamente no es efectivo para todas las subpoblaciones (como hombres y mujeres) por separado?

Cuando la gente dice que la inteligencia artificial destruirá a la raza humana, ¿es que alguien los programará para que estén predispuestos a no gustarle la vida orgánica, o que de alguna manera adquirirán naturalmente las mismas emociones o algoritmos que lo llevan a uno a matar?