¿Por qué Intel Xeon Phi no se usa mucho para acelerar el entrenamiento de aprendizaje profundo?

El número de núcleos paralelos es más importante que el poder de los núcleos individuales en el aprendizaje profundo. Porque estamos haciendo operaciones simples y cortas (convoluciones), pero estamos haciendo muchas de ellas. Entonces, la paralelización es lo más crucial para la velocidad en el aprendizaje profundo.

Entonces, hagamos una comparación: en una tarjeta gráfica NVIDIA Titan X, que a menudo se usa para el aprendizaje profundo, hay 3584 núcleos que se pueden ejecutar en paralelo. Sin embargo, en un procesador Intel Xeon Phi, solo hay alrededor de 60 núcleos. Por lo tanto, usar Xeon Phi sería más lento que usar un procesador de gráficos como Titan X.

Ha habido algunos intentos de introducir sistemas de aprendizaje profundo que pueden funcionar rápidamente con CPU en lugar de GPU, en otras palabras, que dependen menos de la paralelización. Estos fueron principalmente para redes 3D que utilizan núcleos grandes. La idea era hacer que las operaciones de convolución individuales fueran más grandes, para que se beneficiara de la potencia de los núcleos de CPU. No tengo actualizaciones sobre dichos sistemas y las arquitecturas recientes de aprendizaje profundo usan núcleos pequeños (3 × 3) por varias razones.

Aprendizaje automáticoAprendizaje profundoComputación paralelaIntelRedes neuronales artificiales

Related Content

¿Cómo puedo usar Gensim LDA para la clasificación binaria?

¿Cómo la IA puede ser útil en Big Data?

Cómo encontrar la correlación más fuerte entre los vectores de colores a continuación en MATLAB o Python

¿Es posible mejorar automáticamente el archivo digital de una canción mediante muestreo y aprendizaje automático?

¿Qué significa el término de procesamiento del lenguaje natural 'modelo de lenguaje' en términos simples?

¿Hay ejemplos de organizaciones de ciencias de la vida que logren resultados en el descubrimiento de drogas a través del aprendizaje automático que no serían posibles sin el aprendizaje automático?

¿Qué significa 802.11b / g / n / AC?

Aquí hay una respuesta simple, sin bs:

7 TFLOPs vs 11 TFLOPs
$ 1200 vs $ 5k mínimo
Todo mi software está escrito en Cuda.

Entonces, la verdadera pregunta es ¿por qué usaría el xeon phi?

Tapa Ghosh

Mehmet ha dado en el blanco.

Los núcleos paralelos son mucho mejores para el aprendizaje profundo en comparación con la potencia de un solo procesador.

Piénselo de esta manera, ¿consideraría que una persona ultra inteligente hace todo el trabajo, o que muchos humanos normales trabajan simultáneamente?

El trabajo en equipo es mucho más eficiente.

Tapa Ghosh

More Interesting

¿Cuál es el significado del lenguaje de máquina?

¿Cuál es una buena manera de aprender aprendizaje profundo para que un estudiante graduado se una a un grupo de aprendizaje profundo de buena reputación?

¿Qué es una comprensión intuitiva del análisis factorial?

¿El CAPM está muerto, en el sentido de que el aprendizaje automático moderno y el modelado financiero han hecho que su aplicación en el mundo real sea redundante?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Dónde puedo aprender sobre los conceptos básicos de la inteligencia artificial?

¿En qué se diferencia exactamente la generación del lenguaje natural de la comprensión del lenguaje natural?

¿Cuáles son los grandes problemas en la inferencia variacional?

¿Qué conocimientos de matemática / estadística y CS debo dominar (no matemático / stat / CS, pero graduado en ingeniería) para carrera / investigación en aprendizaje automático?

¿Cuál es el atractivo de Python para ML y aplicaciones científicas en general?

¿Cuáles son algunas iniciativas de aprendizaje automático sobre datos sociales?

¿Debo abandonar mi programa de doctorado CS para estudiar por mi cuenta?

¿Cuál es la diferencia entre rpart y randomForest en R?

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cuál es el objetivo de la detección de fraude con tarjeta de crédito?

Web Analytics