¿Podría la renormalización de lotes reemplazar la normalización de lotes virtual en las GAN?

La normalización virtual de lotes elimina por completo la posibilidad de correlación intra-lote, por definición. Eso significa que ningún otro método podría ser “un mejor ajuste” en términos de reducir ese efecto. Lo mejor que pueden esperar otros métodos es también eliminar el mismo problema, al tiempo que es mejor en algún otro aspecto.

La renormalización por lotes podría eliminar por completo la posibilidad de correlación intralote si r y d están completamente sin restricciones. En la práctica, ryd normalmente necesitan ser restringidos, especialmente al comienzo del aprendizaje. No me queda claro si esto sería un problema grave para entrenar GAN sin correlación intra-lote; Lo mejor es probablemente probar la renormalización por lotes y ver si funciona a pesar de las restricciones o ver si el aprendizaje continúa con éxito sin las restricciones.

Si la renormalización por lotes funciona, podría reemplazar la normalización virtual por lotes. La razón no es que la renormalización por lotes se ajuste mejor al problema de modelado; la razón es que la renormalización por lotes tiene la mitad de los requisitos de tiempo de ejecución y memoria.

More Interesting

¿Qué conocimiento se requiere para usar bibliotecas de aprendizaje automático pero no implementarlas?

Cómo especificar si quiero ejecutar una función de paquete Caret para clasificación o regresión

¿Cómo está transformando el aprendizaje automático la investigación en biociencia?

¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?

Cómo etiquetar objetivamente objetos con etiquetas que son subjetivas, en sistemas expertos

Cómo evaluar un experimento además de usar una diferencia en regresión de diferencia

¿Por qué la mayoría de las declaraciones de investigación de aprendizaje automático suenan a mierda?

En PWR, ¿por qué las barras de control están dispuestas en grupos?

¿Cuál es la diferencia entre un contenedor y un algoritmo de filtro en Data Mining / Machine Learning?

¿Cuántos documentos son suficientes para estudiar para escribir una encuesta sobre aprendizaje profundo?

Cómo usar el procesamiento del lenguaje natural (PNL) para resumir un documento en una serie de ideas principales

¿Qué herramienta es mejor para aprender una red neuronal AI, C ++ o MATLAB?

¿Cómo podemos saber si una heurística es mejor que otra sin ejecutarla?

¿Cuál es la distribución condicional completa?

¿Qué tipo de algoritmo de aprendizaje usa el cerebro humano y cómo se compara con los algoritmos que se están desarrollando actualmente para la inteligencia artificial?