¿Podemos entrenar una red neuronal para comprender / interpretar otra red neuronal?

En el procesamiento de imágenes, que es principalmente Redes neuronales convolucionales (CNN), existen varias barreras, la mayor de las cuales es con frecuencia la incapacidad de encontrar suficientes datos etiquetados. Por lo general, se necesitan de unos cientos de miles a varios millones de imágenes de datos etiquetadas para entrenar a una CNN. La solución emergente con implicaciones más allá del procesamiento de imágenes se llama Redes Neuronales Adversarias Generativas (GANN).

Pensamos que las CNN suelen ejecutarse en una dirección, desde la imagen hasta un clasificador que genera la respuesta. Esa respuesta es en realidad una matriz numérica y, de hecho, básicamente puede ejecutar CNN al revés, insertando una matriz numérica para que produzca una imagen.

Entonces, en las GANN, el concepto básico es tener dos CNN separadas para luchar. El primer CNN se conoce como el Discriminador. Su tarea es clasificar correctamente la imagen. El segundo y adversario CNN es el generador. Su tarea es producir imágenes que engañen al Discriminador.

Cuando comienza el concurso, el Generador alimenta las imágenes que ha creado y, por lo tanto, son falsas para el Discriminador que ve estas imágenes junto con las imágenes verdaderas.

El Discriminador quiere ser bueno en esto y se optimiza para no dejarse engañar por el Generador. El Generador también quiere ser bueno para engañar al Discriminador y se optimiza para producir imágenes que el Discriminador no puede decir que son falsas. Finalmente, el Generador produce imágenes tan realistas que el Discriminador solo tiene una probabilidad de 50/50 de ser correcto y la optimización de GANN está completa.

El beneficio es que solo se requería una cantidad mínima de datos ‘verdaderos’ para entrenar. Esto se ha utilizado, por ejemplo, en el entrenamiento de una GANN para identificar verdaderas pinturas francesas del siglo XVIII de falsificaciones donde, por ejemplo, nunca sería posible reunir suficientes imágenes de falsificaciones para entrenar a una CNN de la manera normal. Ver más aquí:

Una cartilla en el aprendizaje automático adversario: el próximo avance en inteligencia artificial

Creo que te perdiste Google I / O 2017 este año.

Aquí, la imagen muestra que la única red neuronal está haciendo análisis de múltiples redes neuronales para estudiar sus características y que la red neuronal del bebé supera a sus redes neuronales rivales recibe una carta de oferta de la red neuronal del padre.

Bueno, puedes acceder a Google I / O 2017 en YouTube para una demostración …

Sí. Uso del aprendizaje automático para explorar la arquitectura de redes neuronales

Simplemente haga una copia de su NN, la copia “interpretará” su NN original muy bien, ¡para ser más precisos!

Simplemente no puedo imaginar para qué podría necesitarlo.

More Interesting

¿Qué opinas del aprendizaje por refuerzo? ¿Sería el próximo 'milagro' como el aprendizaje profundo?

¿Cuáles son los requisitos básicos que debo cumplir para ingresar a Stanford para MS en informática en especialización de inteligencia artificial?

¿Por qué entraste en el campo de la IA?

Los Upanishads: Si se supone que la conciencia está presente en todas partes, ¿por qué no los robots son conscientes?

¿Qué causó el "invierno AI" y cuáles fueron las primeras señales de advertencia? Dado el estado actual de la IA, ¿es probable que haya otro período de bajo interés en el campo? ¿Qué cuellos de botella serían la causa de eso?

¿Los tamaños de kernel de capa maxpooling en CNN son generalmente más pequeños que los tamaños de kernel de capa convolucional? ¿Por qué?

Inteligencia artificial: ¿Qué tan difícil sería crear una criatura robot de la vida real con la IA y la capacidad de entrenamiento de la criatura Blanco y Negro?

¿Cuál es el estado del arte en la "audición" de robots?

¿Cómo comenzar a aprender el aprendizaje automático? ¿Cuál es la hoja de ruta?

¿Cuál será la próxima gran novedad en la visión por computadora, después del rápido progreso en el aprendizaje profundo?

¿Cómo está cambiando la inteligencia artificial internet?

¿Son mónada (programación funcional) y clase (programación orientada a objetos) la misma cosa?

¿Qué opinas del debate entre Norvig y Chomsky sobre el futuro de la IA?

Quien es James Hendler?

¿Cómo utilizamos funciones como la inteligencia artificial y el procesamiento de imágenes en una aplicación?