En el autoencoder variacional, ¿por qué solo tomamos muestras de variables latentes de un gaussiano estándar y aplicamos el decodificador para generar nuevos datos en las pruebas?

A2A. Parece que estás mezclando inferencia y generación. Si pensamos en el VAE como modelo probabilístico, en realidad estamos tratando de aprender un modelo generativo dirigido (piense de arriba hacia abajo, el decodificador es, en cierto sentido, este modelo cuando damos cuenta de las variables latentes). El codificador es realmente una herramienta que nos ayuda a inferir las variables latentes cuando tenemos una observación (un punto de datos).

Entonces, con esto en mente, es crítico que usemos la red de inferencia (codificador) para descubrir rápidamente la variable latente cuando tenemos datos (es decir, mi colega Iulian y yo nos enfocamos en el texto, pero las imágenes son igualmente aplicables), de lo contrario tendríamos que probar mucho el modelo generativo dirigido para encontrar si puede generar la muestra de prueba. Una vez más, la red de inferencia es un atajo (aunque aún podríamos extraer varias muestras para obtener una estimación de Monte Carlo), pero es un atajo de principios ya que estamos optimizando un límite inferior variacional en la probabilidad de registro real (el objetivo es hacer este límite tan apretado como podamos).

Sin embargo, la generación no necesariamente requiere la red de inferencia. Es por eso que el VAE no es realmente un codificador automático, en realidad son dos modelos (uno de abajo hacia arriba y uno de arriba hacia abajo) entrenados conjuntamente. Entonces, con esto en mente, puede ejecutar el modelo generativo dirigido que aprendió en modo de ejecución libre, y dado que su anterior es un Gaussiano fijo, es bastante fácil de hacer. (Tenga en cuenta que el trabajo, como el mío y el de Iulian, muestra que en realidad es mejor aprender lo anterior también, pero nuevamente, el marco VAE sigue siendo el mismo).

AutoencoderestadísticasMachine Learning

Related Content

¿Cómo detectaría el modelo de aprendizaje profundo los mismos objetos varias veces en un parche de imagen si existe?

He realizado el curso de aprendizaje automático de Andrew Ng pero no lo he programado. ¿Debo decir que tengo los conocimientos básicos?

¿Los humanos son actualizadores bayesianos?

Supongamos que reuní a todos los usuarios de Twitter que escribieron tweets con las palabras "aprendizaje automático" en ellos (durante el último mes, por ejemplo), y luego construí un gráfico de red basado en sus seguidores. Además de las diversas medidas de centralidad, ¿qué otras técnicas podría utilizar para identificar a las mejores personas a seguir? ¿Cómo lo hace Klout?

¿Cuáles son algunas aplicaciones interesantes de salud personalizada?

¿Qué significa la desnormalización en computación y cuándo lo haría?

¿Puedo usar word2vec para entrenar un clasificador de aprendizaje automático?

no es esto extraño? En la fase de entrenamiento, la variable latente (entrada del decodificador) debe muestrearse desde la parte posterior (cuya media y std viene dada por la salida del codificador) no como lo que hacemos en la fase de prueba. ¿Por qué simplemente muestrear variables latentes de guassian estancado, descartar información del codificador todavía nos da una buena “información” nueva? Probé en MNIST y esta fase de prueba puede dar una imagen de personaje bastante buena

Jiaxing Wang

More Interesting

¿Es posible aplicar las técnicas de N-gram para el análisis de sentimientos?

¿Alguna de las bibliotecas actuales de aprendizaje profundo permite restricciones de monotonicidad?

¿Las máquinas y los bots respetan la confidencialidad?

¿Cuál es la conexión entre un modelo probabilístico y un gráfico en un modelo gráfico probabilístico?

¿Cuáles son las innovaciones clave en el documento 'Evolución a gran escala de clasificadores de imágenes' de Google Brain?

¿Por qué todavía necesitamos aprender Minería de datos cuando tenemos Mahout?

¿En qué problemas sería buena / mala una máquina neural de Turing?

¿Es posible que una máquina de IA en el futuro descubra o pruebe una ley de la naturaleza por sí misma?

¿Hay grupos de investigación trabajando en aprendizaje profundo teórico?

¿Se pueden usar datos generados por simulación por computadora para algoritmos de aprendizaje automático?

¿Debería estudiar aprendizaje automático, aprendizaje profundo o aprendizaje de refuerzo?

¿Es el modelo de análisis factorial una versión multivariada del modelo de mezcla gaussiana?

¿Qué modo de Anaconda se debe usar para los algoritmos de aprendizaje automático?

¿Qué significa realmente la matriz de covarianza de la estimación de máxima verosimilitud de la distribución normal multivariante?

¿Cómo es usar Theano en Python?

Web Analytics