¿Por qué son importantes las redes de confrontación generativas?

Se ha demostrado que la red de confrontación generativa (GAN) es un modelo / método muy efectivo para entrenar modelos generativos. Hay varias razones por las que los modelos generativos son importantes (de https://arxiv.org/pdf/1701.00160…):

  1. Representar y manipular distribuciones de probabilidad de alta dimensión: las distribuciones de probabilidad de alta dimensión son objetos importantes en una amplia variedad de dominios matemáticos y de ingeniería aplicados. La capacitación y el muestreo de modelos generativos es una prueba excelente de nuestra capacidad para representar y manipular distribuciones de probabilidad de alta dimensión.
  2. Aprendizaje por refuerzo: los modelos generativos se pueden incorporar al aprendizaje por refuerzo de varias maneras. Se pueden usar modelos generativos de datos de series temporales para simular futuros posibles. Dichos modelos podrían usarse para planificar el aprendizaje por refuerzo de varias maneras.
  3. Datos faltantes y aprendizaje semi-supervisado: los modelos generativos se pueden entrenar con datos faltantes y pueden proporcionar predicciones sobre las entradas que son datos faltantes. Un caso particularmente interesante de datos faltantes es el aprendizaje semi-supervisado, en el que faltan las etiquetas para muchos o incluso la mayoría de los ejemplos de capacitación.
  4. Trabajar con salidas multimodales: los modelos generativos, y las GAN en particular, permiten que el aprendizaje automático funcione con salidas multimodales. Para muchas tareas, una sola entrada puede corresponder a muchas respuestas correctas diferentes, cada una de las cuales es aceptable.
  5. Generación de datos: Finalmente, muchas tareas requieren intrínsecamente la generación real de muestras de alguna distribución.

Aquí hay algunas aplicaciones GAN hasta ahora:

  1. Superresolución de imagen: tome una imagen de baja resolución y sintetice un equivalente de alta resolución
  2. Cree arte: las GAN se pueden usar para crear programas interactivos que ayudan al usuario a crear imágenes realistas que corresponden a escenas difíciles en la imaginación del usuario.
  3. Traducción de imagen a imagen : convierta un tipo de fotos en otro tipo o convierta bocetos en imágenes.
  4. Traducción de texto a imagen: genera una imagen realista a partir de una descripción de texto y viceversa
  5. Inpaiting de imagen: completar una imagen con parches faltantes.

Las redes adversarias han abierto muchas direcciones nuevas. La investigación más destacada en aprendizaje automático en los últimos años, en el entorno de alta dimensión (como las imágenes), se centró en el lado discriminatorio. Al mismo tiempo, a medida que el aprendizaje profundo se hizo popular, la necesidad de grandes cantidades de datos ha aumentado.

Las GAN tienden a llenar estos vacíos:

  • Primero, proponen un modelo generativo para imágenes naturales (aunque las imágenes producidas aún no son muy realistas) que evoluciona para generar datos cada vez más realistas, debido al acoplamiento con una red de confrontación. Este marco no se ha utilizado (o al menos no se ha generalizado) en el pasado.
  • En segundo lugar, en principio, cuando no tiene muchos datos para un problema, puede usar redes adversas para “generar” más datos, en lugar de recurrir a trucos como el aumento de datos.

Por supuesto, como mencioné, para las imágenes naturales, las GAN actualmente no generan imágenes muy realistas, pero este trabajo ha despertado el interés en modelos generativos para imágenes naturales, y ha creado una nueva subárea en el aprendizaje profundo, que muchos grupos de investigación son mirando activamente Muchos más artículos en el modelado generativo se han vuelto populares después de las GAN, como los autoencoders variacionales, PixelRNN, etc.

Hay muchas tareas donde no hay suficientes datos etiquetados. Por lo tanto, el aprendizaje no supervisado es probablemente una buena solución para ese tipo de tarea.

GAN es un gran ejemplo de red neuronal que se puede utilizar para el aprendizaje sin supervisión [funcionan bien en datos no etiquetados].

Aquí hay una posible aplicación de GAN para datos no etiquetados -> [1607.02748] Entrenamiento Adversarial para recuperación de bocetos

Porque es creativo y divertido. Genera imágenes o textos que realmente puedes ver. Algunos pueden no ser artísticos o atractivos, pero hay posibilidades de que parezcan realistas. Es muy divertido probar GAN.

Otra cosa es que puede crear un conjunto de datos desde GAN. Hay muchos campos que necesitan un conjunto de datos para entrenar un aprendizaje automático, aunque hay menos datos. Puede usar datos generados por GAN para eso.