¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?

Nunca he hecho esto en un servidor de aprendizaje automático, pero aún puedo tratar de ayudarlo con sistemas distribuidos y computación paralela.

Mi primera recomendación sería intentar hacer esto en el Sistema de archivos distribuidos de Hadoop (HDFS). Prueba el enlace de Microsoft.

Ejecución distribuida de Microsoft

También podría intentar configurar un EC2, pruebe esto la ejecución distribuida y asincrónica de Turi.

Turi

Recomiendo encarecidamente el kit de herramientas de aprendizaje automático distribuido de Microsoft que lo guía a través del marco y puede echar un vistazo al código fuente.

DMTk

En general, probablemente debería aprender primero sobre el aprendizaje automático distribuido y paralelo si no lo ha hecho. Solo para que sepas que no he leído este.

Scaling-Machine-Learning-Distributed

EDITAR: Interfaz de paso de mensajes (olvidé agregar este enlace)

MPI Reduce y Allreduce

De todos modos, tengo tarea que hacer y esto tomó como 5 minutos, así que eso es todo lo que tengo.

Existen varias implementaciones de sistema distribuido con Spark para bibliotecas de aprendizaje profundo.

TensorFlow distribuido | TensorFlow

yahoo / TensorFlowOnSpark

cerndb / dist-keras

Nvidia también proporciona una biblioteca llamada NCCL para ejecutar aprendizaje profundo en múltiples GPU.

Biblioteca de comunicaciones colectivas de NVIDIA (NCCL)

More Interesting

¿Qué problemas o conjuntos de datos existen cuando usar el impulso da mejores resultados que usar un SGD simple?

¿Hay trabajos de investigación que utilicen el aprendizaje profundo para tomar decisiones clínicas?

¿Qué es mejor para alguien que esté dispuesto a hacer un doctorado en visión artificial: conocer un método en profundidad y aplicaciones ampliamente, o lo contrario?

¿Qué es la agrupación conceptual?

¿Por qué no podemos hacer una puerta XOR con 1 neurona?

¿Cómo deberíamos acelerar el procesamiento de datos del lenguaje R?

Un fundador de un fondo de cobertura me dijo que los graduados de doctorado en Big Data / ML están generando un millón de dólares al año como salario en el comercio / fondos de cobertura. ¿Qué tan correcto es esto?

¿Puede un autoencoder sobreajustar cuando tiene una cantidad mucho menor de neuronas de capa oculta que la capa de entrada y también se usa la deserción?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

Para un maestro en aprendizaje automático, ¿cuál sería una mejor opción, KTH (MS en aprendizaje automático) o Chalmers (MS en sistemas adaptativos complejos)?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

¿Cuál es el papel de la Inteligencia Artificial en las redes sociales?

Cómo construir una PC para juegos y para aprendizaje profundo

¿Es legal el raspado web para hacer aprendizaje automático?