¿Qué es el Autoencoder Adversarial?

Aquí puede encontrar una aplicación de Autoencoder Adversarial en el campo de descubrimiento de fármacos: Redes Adversariales Generativas (GAN): Motor y Aplicaciones

Primero debe comenzar con la definición de Autoencoders (¿Qué son los autoencoders?).

En resumen: los codificadores automáticos son modelos que aprenden la función de identidad f ( x ) = x.

Los autoencoders adversarios fueron introducidos por A. Makhzan et al. en 2016 (casi dos años después de la introducción de Redes Adversarias Generativas por I. Goodfellow en 2014)

Si está familiarizado con GAN y Autoencoders, entonces debe comprender este esquema:

La idea clave es hacer coincidir la distribución posterior agregada q (z) con una distribución previa arbitraria p (z).

“Hacer coincidir la parte posterior agregada con la anterior asegura que generar desde cualquier parte del espacio anterior dé como resultado muestras significativas. Como resultado, el decodificador del autoencoder adversario aprende un modelo generativo profundo que mapea lo impuesto antes de la distribución de datos . ”

Hay dos fases de entrenamiento:

1. Reconstrucción:

  • Autoencoder actualiza el codificador y el decodificador para minimizar el error de reconstrucción (aprende a reconstruir mejor f ( x ) = x ).

2. Regularización:

  • La red de adversarios actualiza Discriminator para distinguir las muestras generadas usando el código anterior y las muestras de los códigos ocultos ( Discriminator aprende a ser más cautivo y no engañarse por Generator );
  • La red adversaria actualiza Generator ( Encoder ) para confundir mejor al Discriminador ( Generator aprende a ser más realista para engañar mejor al Discriminador ).

Implementación de AAE -> musyoku / adversarial-autoencoder

Es un Autoencoder que utiliza un enfoque de confrontación para mejorar su regularización. Analicemos esto:

Un Autoencoder es “una red neuronal entrenada para intentar copiar su entrada a su salida” (Deep Learning, Goodfellow, Bengio, Courville, p 493).

Por supuesto, copiar no es el objetivo. El objetivo es la reducción de dimensionalidad a través de una capa de dimensiones más pequeñas que las características de entrada. Eso obliga a la red a aprender los componentes principales.

Puede verlo como la versión de aprendizaje profundo de PCA. Un caso de uso es molesto, esencial en las aplicaciones de IoT.

Los autoencoders ahora se usan más allá de la reducción de dimensionalidad. Y una forma de construirlos es agregar regularización , para poder “jugar” con la arquitectura en lugar de solo la profundidad de la capa.

Y un método para regularizar, propuesto por un equipo de Google, es utilizar la Red Adversaria Generativa (GAN) para obtener más control.

Entonces, el equipo que se le ocurrió la idea lo llamó Autoencoder Adversarial.

Su artículo está aquí: [1511.05644] Autoencoders adversarios)

More Interesting

¿Cómo entrenamos un clasificador para el cual solo tenemos datos de entrenamiento positivos (no hay datos negativos o sin etiquetar disponibles)?

¿Por qué a la gente le gusta la red profunda con menos parámetros de aprendizaje incluso cuando el rendimiento de la prueba es peor que otros?

¿A quién demuestra que los núcleos radiales son núcleos válidos? ¿Cómo se muestra esto mediante la integración de características?

Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python

Cómo comenzar a trabajar en conjuntos de datos de Kaggle

¿Cuáles son algunos de los proyectos que uno puede hacer para comprender SVM y los trucos del kernel?

¿Con qué frecuencia debe verificar el conjunto de validación durante el entrenamiento de la red neuronal en función de los ejemplos de entrenamiento (cada N ejemplos de entrenamiento)?

¿Qué es mejor, el algoritmo de vecinos más cercanos a k (k-NN) o el clasificador de máquina de vectores de soporte (SVM)? ¿Qué algoritmo se usa principalmente en la práctica? ¿Qué algoritmo garantiza una detección confiable en situaciones impredecibles?

¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

Cómo explicar las diferencias entre IBM Watson y Google DeepMind a personas no técnicas

¿Qué habilidades necesito para la IA?

¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?

¿Es posible el aprendizaje automático acelerado por GPU utilizando un controlador de gráficos de software libre?

¿Cuál es el plan de estudios de maestría de Stanford en AI / ML?

¿Es una red neuronal completamente conectada igual a una red neuronal de retroalimentación?