Computación paralela: ¿Cuáles son los buenos enfoques y fuentes para programar CUDA en Machine Learning con datos a gran escala?

Si se trata de datos a gran escala, la GPU individual no es suficiente, porque cada vez que necesita copiar datos de la RAM de la CPU a la RAM de la GPU y después de hacer el cálculo, debe guardar el resultado intermedio, por lo tanto, debe volver a copiar los datos nuevamente en CPU RAM de GPU RAM. Es un proceso que consume poco tiempo.
Resolví este problema construyendo un clúster GPU y escribí mi programa Cuda dentro del marco openMPI, he implementado la simulación de la cadena de Markov en este clúster (fue un proyecto POC).
Hice este clúster con cinco máquinas con una tarjeta GTX 690 de 4 GB, y en cada máquina puse los mismos datos, pero especifiqué en mi programa MPI qué porción de datos usa cada máquina y con este enfoque he disminuido los datos 5 veces por máquina, puede disminuir el promedio todo el tiempo del proceso, pero también aumenta la complejidad del programa, ya que necesita escribir una lógica para combinar el resultado intermedio de cada máquina.

Related Content

¿Cuáles son los avances actuales en la ciencia de datos genómicos?

¿Cómo se puede usar el aprendizaje profundo para la detección de eventos anormales en los videos?

¿Podría la renormalización de lotes reemplazar la normalización de lotes virtual en las GAN?

¿Qué hace que un modelo sea interpretable?

¿Aprender Python en lugar de C ++ es una buena introducción a los lenguajes de programación en medio de la teoría CS / AI?

En el aprendizaje de características, ¿cuál es la regla general para decidir el número de parches aleatorios y el número de iteraciones / épocas con respecto al número deseado de nodos / longitud de la característica?

¿Cómo puedo sobresalir en el aprendizaje automático con antecedentes estadísticos?

Hubo dos cursos en línea sobre programación CUDA C, uno sobre curso y otro sobre udacity (bajo el nombre de “programación paralela heterogénea”)

Bhagirath Bhardwaj

More Interesting

¿Vale la pena desarrollar un algoritmo de minería de datos más rápido que otros de código abierto y comerciales existentes? Si vale lo suficiente, ¿qué valor tiene ser el algoritmo más rápido?

Aprendizaje automático: ¿cómo se puede saber cuándo combinar diferentes características sería útil?

Ingeniero de Aprendizaje Automático de Udacity Nanodegree: ¿Dónde están los proyectos?

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

Cómo comenzar a aprender y codificar Inteligencia Artificial

¿Cuál es la diferencia entre rpart y randomForest en R?

¿Cuáles son las cosas más difíciles o problemáticas para los ingenieros de Machine Learning / Deep Learning?

Cómo aplicar el aprendizaje automático a la realidad virtual / aumentada

¿Cuáles son algunos buenos métodos para el procesamiento previo de datos en el aprendizaje automático?

¿Qué tan útil es la regresión del proceso gaussiano? ¿Tienes un buen ejemplo?

¿Debo elegir PHP para el aprendizaje automático?

¿Por qué la pila de RBM después de aprender no es una máquina de Boltzmann profunda (DBM)?

¿Cómo podría el posmodernismo cambiar el aprendizaje automático?

¿Por qué se usa Python para el aprendizaje profundo si es tan lento?

¿El proceso gaussiano supone que sus covarianzas se mantienen constantes?

Web Analytics