¿Qué les falta a las redes de confrontación para que realmente modelen una representación del mundo?

Para darle una respuesta más concreta, debe definir más claramente qué es la representación del mundo. De acuerdo con el propósito específico, debe determinar alguna función de costo para el discriminador y el generador que debe optimizar de acuerdo con el objetivo que desea alcanzar. Para dominios específicos como la generación de imágenes o secuencias sintéticas, donde la representación del mundo se ha reducido a estos subdominios, los modelos actuales ya han logrado un gran rendimiento.

Si por ‘representación del mundo’ se refería a todo el universo, entonces se vuelve un poco más complicado debido al hecho de que no es trivial determinar una estructura de datos general (vector) para representar todos los artefactos posibles (imágenes, estructuras, criaturas biológicas) , conceptos abstractos, etc.) y función de costo para evaluar el rendimiento del modelo para la estructura de datos generada que podría imitar cualquier posible artefacto.

Creo que hay dos casos en los que GAN no puede representar al mundo.

  1. Datos de entrenamiento:
  1. Gan’s puede generar datos similares a los datos disponibles para capacitación y, hasta ahora, la mayor parte del trabajo ha sido solo generar imágenes en las que funcionan bien.
  • Logrando el equilibrio de Nash:
    1. La principal dificultad que enfrenta GAN hoy en día es lograr el equilibrio de Nash usando el Descenso de gradiente.
    2. Debido a que estamos tratando de minimizar una pérdida no convexa, la pérdida cuando SGD la minimiza solo oscila y nunca alcanza el equilibrio de Nash.