¿Podemos usar variador automático para aprender una representación como el autoencoder de vainilla?

La respuesta corta es sí, pero (tl; dr) …

Después de entrenar un VAE, tenemos dos asignaciones (típicamente parametrizadas por redes neuronales): una red de codificador y decodificador. Esto es lo mismo que un AE de vainilla, pero la diferencia es que estos se asignan a una distribución sobre valores (vectores) en lugar de estimaciones puntuales. ¿Es esta la misma representación que un AE normal? No. ¿Es útil esta representación para tareas similares? Sí (¡y quizás aún más!).

La pregunta es qué quieres hacer con la representación. En general, si desea compararlo con un AE normal, puede simplemente tomar el modo de la distribución resultante y usarlo como una estimación puntual (MAP). Entonces, como mínimo, podemos hacer con un VAE cualquier cosa que podamos hacer con un AE normal. Lo mejor es que, dado que tenemos una distribución en lugar de una estimación puntual, ¡podemos hacer más! Daré dos ejemplos, pero por supuesto hay otros.

Generación de muestras: el VAE, a diferencia del AE, especifica completamente una distribución generativa sobre los objetos que representa. Esto implica que más allá de aprender representaciones de baja dimensión, podemos usar el VAE entrenado para generar instancias del objeto que no existen en los datos de entrenamiento. Esto puede ser muy útil para examinar lo que ha aprendido el VAE, el entrenamiento contradictorio y, por supuesto, sorprender a las personas con imágenes bonitas.

Cuantificación de la incertidumbre: una aplicación de codificadores automáticos es la imputación de datos. Un ejemplo es la pintura de imágenes. Esta es una tarea difícil, y los autoencoders han demostrado ser bastante útiles en esto. Sin embargo, esta es una tarea donde hay mucha ambigüedad inherente. Por ejemplo, aquí está la mitad superior de un dígito de MNIST, el resto ha sido pintado de negro (perdón por la resolución):

La tarea es completar esta imagen: ¿es un 8, un 9 o quizás un 0 que no tiene la mitad inferior? La ambigüedad es real, no hay una respuesta “correcta”, y nos gustaría que nuestro modelo refleje eso. Una AE regular forzaría una respuesta para esto, y la declararía con absoluta confianza. Si tuviéramos un sistema que tomara decisiones basadas en el resultado de la EA, tomaría una decisión basada en esa confianza. Sin embargo, un VAE (con suerte) reconocería esta ambigüedad y la cuantificaría a través de la distribución resultante. Esto podría permitir que el sistema aguas abajo sea más robusto ante los errores.

More Interesting

¿Qué prueba estadística usar para cuantificar la similitud entre dos distribuciones cuando no son normales?

¿Cómo se ha desviado Grok Solutions de la visión de Numenta?

¿Cuál es la diferencia de aprender características latentes usando SVD y usando vectores incrustados en una red profunda?

¿Es posible construir algo así como una red neuronal recurrente simplemente ingresando los mismos datos a lo largo del tiempo (por ejemplo, si los datos son una aceleración, cada entrada es el acc a la vez T)?

¿Qué es un 'descriptor' en el contexto de una transformación de característica invariante de escala (SIFT)?

Hablando intuitivamente, ¿cuál es la diferencia entre la estimación bayesiana y la estimación de máxima verosimilitud?

¿Dónde puede encontrar ejemplos de codificación de TensorFlow no obsoletos?

¿Cómo se recupera la información de las cajas negras?

¿Cómo debo proceder después de completar el curso de aprendizaje automático de Andrew Ng?

¿Cómo puede Machine Learning ayudar a un desarrollador de Android?

¿Qué algoritmos de aprendizaje automático utilizan servicios como wit.ai y api.ai?

¿Cómo se comparan las bibliotecas de aprendizaje automático de C ++ con las disponibles en Python?

¿Deberíamos comenzar con Tensorflow, Keras o Sonnet para desarrollar un sistema de predicción de datos de series temporales? ¿Debemos usar solo lenguajes basados ​​en Python?

¿Cómo debo abordar mi tesis sobre 'conversión de lenguaje de señas a texto'? ¿Cuál debería ser el método?

¿Cuál es el papel de la Inteligencia Artificial en las redes sociales?