¿Cuántas veces más rápido es una supercomputadora que una PC?

Si está comparando el rendimiento de la supercomputadora con casi cualquier programa que ejecute en una PC, la supercomputadora será, en el mejor de los casos, un poco más lenta (suponiendo procesadores idénticos). Si la aplicación no está sintonizada para aprovechar el paralelismo masivo, las interconexiones rápidas y un sistema de archivos paralelo sintonizado, entonces tratará el único nodo de cómputo que ocupa como simplemente otra computadora genérica.

Si está comparando el rendimiento en una aplicación que comúnmente se ejecuta en decenas o cientos de miles de núcleos (y asume que la PC está conectada al mismo sistema de archivos paralelo que la supercomputadora), la desaceleración en la PC será un múltiplo de diferencias en las tasas de operaciones de punto flotante por segundo (y para aplicaciones de física estrechamente acopladas, eso es múltiple tendrá al menos dos dígitos). La PC pasará casi todo su tiempo cargando y descargando el conjunto de trabajo del nodo de cómputo actual que está imitando, lo que significa que se realizará muy poco trabajo real por la cantidad de esfuerzo invertido.

Hay algunas buenas respuestas aquí. Me gustaría tomar un rumbo ligeramente separado para proporcionar una respuesta. Aquí está mi pregunta revisada: ¿Cuánto desea pagar por la velocidad? Barato, una PC. Barato, una supercomputadora en tiempo compartido al costo más económico durante la noche. Caro, una supercomputadora con la tasa de respuesta de prioridad máxima “inmediata”.

Las supercomputadoras son súper rápidas para cualquier y (principalmente) todos los problemas computacionales. La verdadera pregunta es: “¿Qué tan rápido necesita sus respuestas?” Un amigo realmente tomó una aplicación que se ejecutó en un Cray X-MP y la transfirió a una mini computadora DEC para un cliente. La aplicación funcionó durante 10 minutos en Cray y durante 8 horas en DEC. ¡El problema era que el *** costo *** de ejecutarlo en Cray requería que se ejecutara como una operación por lotes aproximadamente a las 3:00 AM! … Por lo tanto, una espera de la noche a la mañana! La ventaja del DEC fue, de la noche a la mañana, también al mismo costo operativo. ¡PERO! ¡El DEC estaba disponible las 24 horas del día, los 7 días de la semana para una repetición durante el día, si es necesario (sin cargo adicional)!

Piénselo de esta manera: usted vuela en un Concord de Londres a la ciudad de Nueva York en 3-1 / 2 horas y luego pasa 6 horas en tráfico *** feo *** para llegar a su destino. O bien, vuelas en la misma ruta y tienes suficiente cambio de repuesto para contratar un helicóptero para saltarte los legendarios embotellamientos de Manhattan (por el mismo costo y velocidad).

PD. En cuanto al costo, considere esta regla general: ¡10x en velocidad = 100x en costo! Y tendrá un buen comienzo para responder su pregunta.

La comparación no tiene sentido por varias razones:

  1. Las supercomputadoras no son homogéneas. La lista de los 500 mejores sitios de supercomputadoras muestra que hay una diferencia de casi 200 veces en el rendimiento de los sistemas clasificados primero y 500
  2. Por lo demás, las PC no son homogéneas. La cantidad de núcleos de CPU, CPU en el sistema y el rendimiento de cada núcleo individual varían: hay una nueva generación de CPU cada año. Una PC de 30 años será mucho más lenta que una construida a partir de componentes actuales de primera línea.
  3. Ni las PC normales ni las supercomputadoras usan un solo núcleo para sus cálculos. En el mercado de consumo, las CPU de doble núcleo se han convertido en el estándar de facto para computadoras portátiles y de escritorio hace varios años y las CPU de cuatro núcleos son cada vez más frecuentes a medida que pasa el tiempo. Las supercomputadoras se componen de una gran cantidad de nodos , cada uno con múltiples CPU, y esos son procesadores de nivel de servidor con hasta 12 núcleos físicos, logrando así el increíble rendimiento agregado .
  4. Las supercomputadoras generalmente no son más rápidas , son más paralelas . La supercomputadora más rápida del mundo utiliza una cantidad masiva de procesadores Xeon E5-2692 de 12 núcleos, que son más lentos por núcleo que las CPU de gama alta en el mercado de consumo, pero lo hacen en una operación multiproceso gracias a su gran cantidad de núcleos: ver Comparación de rendimiento de CPU entre un chip Xeon similar y la CPU de consumo insignia actual: el rendimiento de Xeon en operaciones de un solo subproceso es peor que el del i7, pero el rendimiento de subprocesos múltiples es significativamente mejor.
  5. Si bien podría comparar el rendimiento agregado de las CPU y los núcleos de un sistema de escritorio con el rendimiento agregado de una supercomputadora, no se escala al alto rendimiento en operaciones que no se pueden dividir en una gran cantidad de tareas paralelas (si pueden paralelizarse en todos) para aprovechar los múltiples núcleos y / o CPU disponibles.
  6. Para resumir, una supercomputadora superará a una PC de consumo en escenarios que permiten que los cálculos sean muy multiproceso. En las tareas que no escalan bien, si es que lo hacen, lo que significa la mayoría de las aplicaciones de grado de consumo, el hardware de la supercomputadora podría funcionar peor.

Como suele ser el caso con la ciencia, hay más de una respuesta correcta, y algunas de estas respuestas se contradicen. El problema proviene de la palabra “rápido”. “Rápido” puede referirse a varias métricas diferentes, las más importantes son la latencia y el ancho de banda . Ambos son bastante fáciles de entender. La latencia es el tiempo entre el momento en que comienza su trabajo y el momento en que termina. El ancho de banda es la cantidad de información que puede procesar por segundo. Para una tarea pequeña (básicamente cualquier cosa que pueda encontrar como un usuario “normal”), su PC (o incluso su teléfono, en estos días) probablemente supere a cada supercomputadora.

Como han surgido muchas otras respuestas, las supercomputadoras son súper porque en realidad son una tonelada de computadoras individuales conectadas en red para operar en la misma tarea. Es posible que las computadoras individuales ni siquiera sean muy “rápidas” en términos de velocidad de reloj, lo que significa que para una tarea en serie, cada uno de los nodos podría ser más lento que su PC.

Su GPU es una supercomputadora. ¿Alguna vez has notado que las velocidades de reloj de la GPU son relativamente bajas? Las GPU “más rápidas” rondan alrededor de 1 GHz en velocidad de reloj, mientras que su CPU puede estar operando cerca de 4 GHz. Debe quedar bastante claro que la GPU existe en primer lugar porque la CPU no es lo suficientemente “rápida”. Esto se debe a que su GPU es en realidad un subsistema de aproximadamente 1000 (o más, dependiendo de lo que pagó). El procesamiento de gráficos es fácil de dividir en muchas tareas pequeñas (¡una por píxel, en realidad!), Por lo que descargamos a un procesador que en realidad es una tonelada de pequeños procesadores individuales.

Por extraño que parezca, puede construir una supercomputadora de “bajo presupuesto” en estos días conectando en red una cantidad modesta de nodos (digamos 16), cada uno con un par de GPU si puede transcodificar su proceso a código GPGPU. Todavía lo retrasará decenas de miles, pero es sorprendentemente cercano a algunas de las instalaciones de millones de dólares que compiten por ser la supercomputadora “más rápida”.

La métrica típica del rendimiento de una supercomputadora es la cantidad de coma flotante (número decimal) de operaciones que se pueden hacer por segundo (llamadas FlOps). Se utiliza porque la mayoría de las supercomputadoras se utilizan para ejecutar simulaciones científicas, que calculan muchas ecuaciones matemáticas. Sin embargo, también se pierde mucho porque un cómputo dado puede no requerir una gran métrica porque muchas aplicaciones pueden requerir menos Flops pero más capacidad de memoria o ancho de banda de red, pero es una aproximación aproximada. Las supercomputadoras principales de hoy en día pueden realizar ~ 10 ^ 15 FlOps, mientras que los Xeons multinúcleo actuales pueden realizar ~ 10 ^ 11 FlOps, por lo que las supercomputadoras son aproximadamente 10,000 veces mejores para hacer lo que las supercomputadoras fueron diseñadas para hacer.

Sin embargo, funcionan mal o no son rentables para cargas de trabajo para las que no fueron diseñadas, como la compilación de código, servidores web o firewalls.

Esta pregunta no puede ser respondida en general. Sin embargo, muchas supercomputadoras se basan en procesadores regulares como Intel Xeons. Eso lo hace algo factible. Por ejemplo, la estampida del Texas Advanced Computing Center tiene 6400 nodos con 2 Xeons cada uno, por lo que se podría decir que es 13000 veces más rápido que una PC. Sin contar los coprocesadores Xeon Phi. Este tipo de cálculo es un poco más difícil de hacer con supers que se basan en Blue Gene, Sparcs y otros procesadores que no son de PC.

Las 500 computadoras más rápidas del mundo están clasificadas en una lista conocida como las 500 mejores. Noviembre de 2015 | Sitios de supercomputadora TOP500. Las máquinas más rápidas en esta lista tienen cientos de miles de núcleos y la máquina mejor clasificada tiene 3.1 millones de núcleos Intel Xeon, lo que le da una idea de cuán poderosas son estas máquinas. Sin embargo, las supercomputadoras como estas se miden por la cantidad de instrucciones de coma flotante por segundo o por la rapidez con que ejecutan el estándar de referencia de la industria conocido como Linpack. Por ejemplo, la máquina más rápida puede realizar 33.86 petaflops.

Entonces, para encontrar la respuesta precisa a su pregunta, solo necesita obtener los números correspondientes para la PC que le interesa. Una PC moderna y rápida le dará aproximadamente 200 Gflops aproximadamente, pero se lo dejaré a usted para que haga los cálculos.

Como otros han dicho, sería muy difícil ejecutar el mismo punto de referencia tanto en una PC como en una supercomputadora. Pero los puntos de referencia de Linpack podrían proporcionar una medida aproximada y lista, y dicen que hay un factor de aproximadamente 1 millón.

LINPACK – Wikipedia