Nunca he hecho esto en un servidor de aprendizaje automático, pero aún puedo tratar de ayudarlo con sistemas distribuidos y computación paralela.
Mi primera recomendación sería intentar hacer esto en el Sistema de archivos distribuidos de Hadoop (HDFS). Prueba el enlace de Microsoft.
Ejecución distribuida de Microsoft
- ¿Qué hay de nuevo con Wasserstein GAN?
- ¿Cuándo se utilizarían los bosques aleatorios sobre las máquinas potenciadas por gradiente (GBM)?
- ¿Es posible que, en el futuro, los países sean manejados por una súper computadora que calcule el mejor resultado de una decisión política?
- Cómo distinguir el Aprendizaje profundo de los anteriores análogos en las composiciones de funciones, más específicamente el trabajo reciente sobre el "proceso gaussiano profundo"
- ¿Qué es el sesgo y la varianza?
También podría intentar configurar un EC2, pruebe esto la ejecución distribuida y asincrónica de Turi.
Turi
Recomiendo encarecidamente el kit de herramientas de aprendizaje automático distribuido de Microsoft que lo guía a través del marco y puede echar un vistazo al código fuente.
DMTk
En general, probablemente debería aprender primero sobre el aprendizaje automático distribuido y paralelo si no lo ha hecho. Solo para que sepas que no he leído este.
Scaling-Machine-Learning-Distributed
EDITAR: Interfaz de paso de mensajes (olvidé agregar este enlace)
MPI Reduce y Allreduce
De todos modos, tengo tarea que hacer y esto tomó como 5 minutos, así que eso es todo lo que tengo.