¿Cuál es actualmente la mejor GPU para el aprendizaje profundo?

Le recomiendo que elija la siguiente tarjeta gráfica, ya que eso es lo que uso y puedo garantizar su rendimiento:

Tarjeta gráfica ASUS GeForce GTX 1080 8GB Turbo TURBO-GTX1080-8G

Gran tarjeta Temperaturas de stock relativamente tranquilas. Puede dejar la configuración predeterminada y disfrutarla. El stock de puntuación de Unigene Heaven fue de 2745, con un mínimo de 30, un promedio de 109 y un máximo de 225 fps a 1080p, todo completamente al máximo.

Si desea experimentar con el overclocking, tome el software gratuito MSI Afterburner 4.3 (actualmente en versión beta durante este escrito) y puede usar y establecer información de curva de ventilador personalizada basada en la temperatura de la tarjeta de crédito, es realmente agradable. Coloco la mía entre 80-100% de velocidad de amante desde 70 niveles en adelante para mantenerla por debajo de 83 y ver qué puede hacer. No ha tocado la configuración de voltajes, energía o espacio de memoria en absoluto. Podría obtener + 235Mhz en el núcleo con el aumento de los entusiastas de Heaven y las puntuaciones de velocidad 4.0 pasaron a: 30.3 min, 116 avg, 242.3 max. Esto fue solo por diversión, realmente no necesita OC y realmente me gusta el procedimiento completo en stock, por lo tanto, lo puse de nuevo por el momento. Pero es bueno saber que puede sacarle más rendimiento si lo desea.

Podría entender que esta tarjeta se vende por más de MSRP, lo cual es una locura en este momento porque son muy caros. Estaba en la cerca entre el 1070 y el 1080. No estaba seguro de si valía la pena el dinero extra para el 1080. AHORA ESTOY satisfecho de haber sacado la causa. Sin arrepentimientos. ¡Me encanta esta bestia de una tarjeta!

Eso depende de quién eres y qué estás tratando de lograr

  • Para la persona / profesional promedio, sería la GTX 1080. Esto ha sido declarado por muchos en la comunidad de Deep Learning y funciona muy bien para la mayoría de las aplicaciones.
  • Para una persona más seria que quiere competir (y ganar) concursos de Kaggle DL, el Titan X Pascal. Necesitas mucha memoria para Convnets y los núcleos adicionales de Cuda serían una bendición.
  • Para el investigador promedio que tiene un presupuesto de investigación para gastar, entonces probablemente debería ir con el P100. Es como el k80 con esteroides; Pero es muy caro.
  • Para un centro de datos, el DGX-1, como señaló Sonia, sería la mejor opción. Pero la mayoría de las empresas no necesitarán una GPU gigante como esa.

También estaría en desacuerdo con que el k80 es el mejor para el aprendizaje profundo como alguien señaló a continuación. Los k80 se basan en las arquitecturas de Maxwell; mientras que los Titan X se basan en las arquitecturas Pascal más nuevas y mucho más rápidas. Ha habido discusiones sobre esto en Quora; y el consenso parece ser que el Titan X supera al k80 en la mayoría de los puntos de referencia DL.

¡Hola chicos!

En los próximos días, esperamos reunir comentarios y sugerencias de la comunidad de Deep Learning sobre la mejor forma de comparar el DGX-1 de NVIDIA para la formación de arquitecturas DL.

Pronto tendremos esta supercomputadora a nuestra disposición para realizar pruebas y nos gustaría conocer su opinión sobre cómo evaluar mejor su rendimiento.

Si está interesado en realizar sus pruebas, contáctenos lo antes posible.

Ya hemos realizado Benchmarks en NVIDIA GTX1080 -TITAN X Maxwell -TITAN X Pascal – K40 Deep Learning Benchmarks

Consulte nuestra publicación de blog para obtener información: bit.ly/DGX1-Benchmark

Escriba un comentario debajo de las publicaciones del blog y nos pondremos en contacto con usted; si lo prefiere, escriba un correo electrónico para obtener más información: [correo electrónico protegido]

Actualmente, Titan V de Nvidia es la mejor GPU para el aprendizaje profundo y las operaciones de IA. El Titan V se basa en la última arquitectura Volta . Combina núcleos CUDA y núcleos especiales creados por Nvidia para el aprendizaje profundo conocidos como núcleos Tensor , ofreciendo 110 teraflops de rendimiento. Está equipado con 640 núcleos tensoriales, 5120 núcleos CUDA, 21 mil millones de transistores y memoria HBM2 de 12 gb. Por lo tanto, es la tarjeta gráfica más rápida jamás creada. Pero no es barato, una sola tarjeta cuesta 3000 $.

Las GPU NVIDIA dominan el campo en este momento, porque CUDA es muy dominante.

Hay tres consideraciones cuando se trata de rendimiento de aprendizaje profundo:

1. Unidades informáticas

2 memoria

3.Double vs unidades flotantes

Mientras que 1 y 2 son bastante obvios, el tercero no lo es. A menudo, las tarjetas de juego en la actualidad tienen menos unidades de doble precisión que sus variantes de la industria.

Sin embargo, el maestro de rendimiento claro debería ser el NVIDIA Tesla K80. Su hoja de datos lo identifica como un monstruo que contiene 5000 unidades en comparación con los 3k de un TitanX, 24 Gigas de memoria ECC en comparación con 12 Gig y muchas unidades dobles.

Ni siquiera tiene una ranura para conectarle un monitor.

Algunas opciones más baratas para una persona con presupuesto limitado podrían ser: GTX 1080 y GTX 1070. Estas dos GPU tienen un poco menos de memoria en comparación con el Titan V y el Titan X. Pero son realmente buenas por el precio. Tanto 1070 como 1080 tienen 8 GB de memoria en comparación con la serie Titan, que tiene un mínimo de 12 GB de memoria. Pero para construir una PC doméstica, creo que 1080 y 1070 son más asequibles.