¿Cuál es el diagrama de red de DeepDream de Google?

DeepDream en sí mismo no está ajustado a una arquitectura específica. Es un enfoque que puede lograr con cualquier red neuronal convolucional profunda previamente capacitada.

La idea, simplemente, es como tener un ciclo de retroalimentación en el modelo de clasificación de imágenes. Usted le da una imagen al modelo, y le da algunos puntajes sobre los objetos en los que fue entrenado que cree que podrían existir en la imagen. Luego, deja que la red modifique la imagen de entrada para hacer que estos objetos sean visibles cada vez más. Puedes repetir esto más de una vez.

El anuncio original del artículo del blog de Google DeepDream mostró ejemplos del uso de DeepDream en el modelo GoogLeNet pre-entrenado en imágenes ImageNet, y el modelo MIT Places CNN entrenado en imágenes de lugares.

La arquitectura del modelo GoogLeNet consta de 22 capas, que se muestran a continuación:

Deep Dream es más o menos un algoritmo que puede aplicar a cualquier red neuronal de avance. Si sabe un poco sobre las redes neuronales, la idea detrás de esto es bastante simple: use la propagación hacia atrás como lo hace durante el entrenamiento, pero en lugar de cambiar los pesos de la red, cambie la imagen de entrada.

Entonces paso a paso:

  1. Elige una capa y un filtro que te parezcan interesantes.
  2. Calcule las activaciones para su imagen hasta esa capa
  3. Volver a propagar las activaciones de su filtro a la imagen de entrada
  4. Multiplique los gradientes con su tasa de aprendizaje y agréguelos a su imagen de entrada
  5. Repita los pasos 2 a 4 hasta que esté satisfecho con el resultado.

El cuaderno de IPython de los chicos de Google (también vinculado en la respuesta anónima) tiene algunos consejos útiles para producir imágenes atractivas.

Si desea obtener más información sobre las redes neuronales convolucionales, le sugiero este curso.

Si ya conoce CNN y desea obtener más información sobre la propagación hacia atrás, Wikipedia tiene un buen artículo.

Si desea profundizar en la ciencia detrás de Deep Dream, la literatura relevante es Simonyan et al. (2013) (sección 2, Visualización del modelo de clase) y Mahendran y Vedaldi (2014). También me gustaron Nguyen et al. (2016)

Deepdream no tiene arquitectura de red.

Es un script de Python independiente que carga la red neuronal caffee pre-entrenada, y produce un resultado al proporcionarle la imagen proporcionada.

Puede ejecutarlo absolutamente en su máquina doméstica, incluso en el sistema de Windows (usando vagabundo o sin él).

More Interesting

¿Será posible tener una máquina de IA que construya su propio lenguaje de programación y se desarrolle / mejore por sí mismo?

Después de la singularidad, ¿por qué la IA querría destruir a los humanos?

¿Los manifestantes anti-robot en SXSW son indicativos de un amplio sentimiento anti-robot?

¿La IA significa fatalidad para la fuerza laboral?

¿Cómo impactará la inteligencia artificial en el mercado laboral y la economía estadounidense?

¿Cuáles son algunas instituciones / empresas de investigación que trabajan en inteligencia humana o fusionan la inteligencia humana con la inteligencia artificial?

¿Puede un software de aprendizaje automático discernir entre dos tipos de construcción de frases?

¿Cuál es la aplicación del aprendizaje automático en contabilidad / auditoría / impuestos y finanzas corporativas?

¿Qué tan bien te prepara el curso Coursera de Geoff Hinton para una carrera en aprendizaje automático con redes neuronales?

¿Cómo sería posible que AI creara películas basadas en CGI basadas en IMDB TOP100?

Necesito aprender los conceptos básicos del aprendizaje automático rápidamente, para mi trabajo. ¿Dónde empiezo?

¿Cuáles fueron los avances más importantes en la IA de juegos de estrategia en tiempo real en los últimos 15 años?

¿En qué tipo de aprendizaje automático (supervisado, no supervisado, refuerzo) se podría clasificar la predicción de rama?

¿Cuáles serán los recursos por los que competirá la verdadera inteligencia artificial?

¿Cuáles son las diferencias funcionales entre un procesador de computadora diseñado para IA (por ejemplo, Tensor / TPU) y un procesador ordinario (CPU) o GPU?