¿Cuáles son los casos de uso (existentes o futuros) en los que el uso de la Red Adversaria Generativa es particularmente interesante?

Una de mis aplicaciones favoritas de las Redes Adversarias Generativas (GAN) es la síntesis de texto a imagen.

Por loco que parezca, los investigadores de la Universidad de Michigan (EE. UU.) Y el Instituto Max Planck (Alemania) han construido una tubería para generar imágenes a partir del texto. Por ejemplo, puede generar una imagen de lo que le gustaría ver (CF: imagen a continuación). No solo obtuvieron resultados impresionantes en los conjuntos de datos de pájaros / flores, sino que demostraron que este tipo de tecnología es realmente posible. Tenga en cuenta que este documento es bastante nuevo (mayo de 2016) y todos los días se avanza en este campo.

Ahora piense un poco en lo que podría darnos en el futuro . Imagine un software como Photoshop donde podría crear nuevos objetos dando su descripción. “Puesta de sol en una montaña nevada”, “Oso pardo mirando a la izquierda”, “Humano angustiado corriendo”. Y tendría la base para su nueva obra maestra digital.

El documento sobre ArXiv:

https://arxiv.org/pdf/1605.05396…

Un gran video sobre GAN de documentos de dos minutos:

Jun-Yan Zhu y sus colaboradores hicieron el genial iGAN:

Las GAN se usan / (se pueden) utilizar ampliamente en todos los casos en los que se utilizan modelos generativos y técnicas como VAE, pixelRNN, DBM. Ejemplo para la generación de texto / imagen / video, la ventaja de usar GAN es que son más rápidos y fáciles de entrenar que los enfoques tradicionales como las máquinas boltzman. Las GAN no requieren ninguna aproximación y pueden capacitarse de extremo a extremo a través de redes diferenciables, lo que las convierte en modelos mejores y más efectivos para ser empleados ahora y en el futuro. Un caso de uso existente interesante para las GAN es la criptografía y la piratería (modelos de codificador-decodificador), en los que estoy trabajando.

More Interesting

¿En qué condiciones funcionaría un algoritmo lento más rápido que un algoritmo rápido?

¿Por qué no hay bloqueadores de anuncios impulsados ​​por el aprendizaje automático?

¿Qué (empíricamente) necesita más datos de entrenamiento (etiquetados): modelos discriminativos o modelos generativos?

¿Qué industria utiliza una máquina de granallado?

¿Por qué aprendiste Machine Learning?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

¿De qué fuente será mejor aprender el aprendizaje automático?

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Se puede extraer información significativa de datos hash para el aprendizaje automático?

¿Cuáles son las consecuencias y desventajas de usar datos agregados? ¿Cómo podemos combatirlos si no hay datos de nivel granular?

Si quiero aprender mucho sobre IA, aprendizaje automático y ciencia de datos, y no tengo absolutamente ninguna experiencia sobre ellos, ¿por dónde empiezo?

¿Por qué los modelos acústicos DNN / HMM son mejores que GMM / HMM?

¿Podemos usar SGD para entrenar el modelo de mezcla, como GMM y movMF?

¿Cuál es el error de la bolsa en bosques aleatorios? Qué significa eso? ¿Cuál es un valor típico, si lo hay? ¿Por qué sería mayor o menor que un valor típico?

¿Es posible usar el servicio de reconocimiento facial de Facebook desde su API?