¿Cuáles son los casos de uso (existentes o futuros) en los que el uso de la Red Adversaria Generativa es particularmente interesante?

Una de mis aplicaciones favoritas de las Redes Adversarias Generativas (GAN) es la síntesis de texto a imagen.

Por loco que parezca, los investigadores de la Universidad de Michigan (EE. UU.) Y el Instituto Max Planck (Alemania) han construido una tubería para generar imágenes a partir del texto. Por ejemplo, puede generar una imagen de lo que le gustaría ver (CF: imagen a continuación). No solo obtuvieron resultados impresionantes en los conjuntos de datos de pájaros / flores, sino que demostraron que este tipo de tecnología es realmente posible. Tenga en cuenta que este documento es bastante nuevo (mayo de 2016) y todos los días se avanza en este campo.

Ahora piense un poco en lo que podría darnos en el futuro . Imagine un software como Photoshop donde podría crear nuevos objetos dando su descripción. “Puesta de sol en una montaña nevada”, “Oso pardo mirando a la izquierda”, “Humano angustiado corriendo”. Y tendría la base para su nueva obra maestra digital.

El documento sobre ArXiv:

https://arxiv.org/pdf/1605.05396…

Un gran video sobre GAN de documentos de dos minutos:

¿Por qué la mayoría de las competencias recientes se centran en el aprendizaje profundo / redes neuronales? ¿No crea esto un desequilibrio en los tipos de problemas que se ofrecen?

¿Cuáles son las cosas básicas que debe saber un ingeniero informático antes de aprender sobre ciencia de datos y aprendizaje automático?

¿Cuál es el papel de un neurocientífico en el desarrollo de inteligencia artificial?

Cómo explicar el desempeño de un modelo predictivo a la gerencia que no conoce el aprendizaje automático

¿Cuál es la mejor computadora portátil con una buena pantalla y un factor de forma delgado por menos de $ 700?

En Machine Learning: ¿por qué siempre entrenamos una muestra en lugar de todo el conjunto de datos / base de datos?

Jun-Yan Zhu y sus colaboradores hicieron el genial iGAN:

Sai Rajeshwar

Las GAN se usan / (se pueden) utilizar ampliamente en todos los casos en los que se utilizan modelos generativos y técnicas como VAE, pixelRNN, DBM. Ejemplo para la generación de texto / imagen / video, la ventaja de usar GAN es que son más rápidos y fáciles de entrenar que los enfoques tradicionales como las máquinas boltzman. Las GAN no requieren ninguna aproximación y pueden capacitarse de extremo a extremo a través de redes diferenciables, lo que las convierte en modelos mejores y más efectivos para ser empleados ahora y en el futuro. Un caso de uso existente interesante para las GAN es la criptografía y la piratería (modelos de codificador-decodificador), en los que estoy trabajando.

Sai Rajeshwar

More Interesting

¿En qué condiciones funcionaría un algoritmo lento más rápido que un algoritmo rápido?

¿Por qué no hay bloqueadores de anuncios impulsados por el aprendizaje automático?

¿Qué (empíricamente) necesita más datos de entrenamiento (etiquetados): modelos discriminativos o modelos generativos?

¿Qué industria utiliza una máquina de granallado?

¿Por qué aprendiste Machine Learning?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

¿De qué fuente será mejor aprender el aprendizaje automático?

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Se puede extraer información significativa de datos hash para el aprendizaje automático?

¿Cuáles son las consecuencias y desventajas de usar datos agregados? ¿Cómo podemos combatirlos si no hay datos de nivel granular?