Básicamente, un autoencoder de vainilla es una red neuronal que recibe una imagen y luego la reconstruye. Hay una parte del codificador de la red que toma la imagen y crea un vector latente (un vector que no puede reconfigurarse instantáneamente en una imagen) que es esencialmente una versión preparada de su imagen que ahora está en una dimensión mucho más baja espacio (solo un par de carrozas en lugar de una imagen completa). Este vector latente se puede alimentar a una red decodificadora que ‘desengancha’ el vector latente en la misma imagen.
Al mismo tiempo, podríamos hacer nuestros propios vectores latentes (dibujar valores aleatorios) y alimentarlos en la parte del decodificador y obtener una imagen híbrida extraña que realmente no se parece mucho. Esto se debe a que la mayoría de nuestros vectores latentes estarán fuera del espacio de datos que le hemos dado a las redes, por lo que para aumentar nuestras posibilidades de elegir buenos vectores latentes, restringimos los vectores latentes que genera la parte del codificador para extraerlos Una unidad de distribución gaussiana. De esta manera, cuando tomamos muestras de la distribución gaussiana de la unidad, podemos estar seguros de que el decodificador puede decodificarlo en algo razonable.
Para restringir la red, le damos dos pérdidas (hay dos objetivos aquí), uno es latent_loss, que mide la pérdida de la ‘unidad gaussiana’ del vector latente, que lo penaliza si el vector latente no se pega a la unidad de distribución gaussiana. También hay una segunda pérdida, que es la pérdida de imagen real, ya que el autoencoder también debe asegurarse de que la imagen de salida coincida con la imagen de entrada. Al combinar estos dos, la red tiene que negociar, encontrando la mejor combinación de low latent_loss (unidad de distribución gaussiana de vectores latentes) y low image_loss (alta similitud entre las imágenes de entrada y salida). Latent_loss solo se evalúa a cero (perfecto) cuando la media es 0 y stddev es 1, que es una unidad gaussiana.
- ¿Dónde puedo encontrar un tutorial detallado sobre los árboles de decisión?
- ¿Qué hace que los parámetros del modelo sean variables latentes?
- ¿SSD es realmente mejor que YOLO?
- ¿Qué tipos de trabajos están disponibles en la industria financiera para un máster en ML / AI graduado?
- ¿Cuáles son algunos de los conjuntos de habilidades esenciales que debe tener un desarrollador de aprendizaje automático?