¿Cuánto cuesta hacer una supercomputadora?

Una supercomputadora debe ser ambas:

  • Capaz de resolver problemas “más grandes” que una computadora ordinaria
  • Capaz de escalar para resolver problemas más grandes a un costo mayor

Eso generalmente significa que los programas de supercomputadora dividen el trabajo en muchas piezas que se ejecutan simultáneamente (en paralelo) para realizar todo el cálculo más rápido, y agregar más elementos de procesamiento permite una ejecución más paralela.

Solía ​​ser que los módulos que componen una supercomputadora eran en gran medida hardware personalizado y costosos de diseñar y construir. Después de que mi grupo construyó la primera supercomputadora de PC con Linux en el mundo en la Universidad de Purdue en febrero de 1994, y el proyecto Beowulf más publicitado construyó uno para la NASA a finales de ese año, la industria rápidamente cambió a la construcción de supercomputadoras utilizando módulos e interfaces que normalmente se usaban en PC: lo que redujo drásticamente el costo y permitió una personalización mucho más flexible del sistema.

El resultado es que las pequeñas supercomputadoras que cuestan alrededor de $ 20,000 ahora son muy comunes , a menudo tratadas como “equipos de laboratorio” por los científicos o ingenieros que las usan. Sin embargo, también hay sistemas MUCHO MÁS GRANDES creados como recursos compartidos para cientos de usuarios o creados específicamente para resolver problemas importantes que requieren grandes cantidades de cómputo (por ejemplo, simulación de armas nucleares, modelado climático, química computacional). El costo de los sistemas más grandes es discutible porque no está claro cuánta infraestructura (edificios, plantas de energía, etc.) debe contarse como parte del costo de la máquina, pero las supercomputadoras más grandes tienden a superar los $ 300,000,000 , aproximadamente lo mismo cuesta como un solo avión de combate F-35. El muro fronterizo de Trump podría costar fácilmente más que el total que el gobierno de EE. UU. Ha gastado en todas las supercomputadoras que ha comprado.

En estos días, las supercomputadoras son constelaciones de blades de procesador con tejidos de interconexión de súper alta velocidad.

El costo de construir supercomputadoras puede ser bajo: he construido lo que podría describirse como una supercomputadora utilizando un grupo de placas de procesador con procesadores ARM de cuatro núcleos a 1,6 GHz e interconexión gig-E. Mi costo total es de un par de grandes. Al ir mucho más grande, pronto descubro que mis costos de interconexión disminuyen los costos de mi CPU …

Lo mismo es cierto a mayor escala: incluso si usa blades con múltiples procesadores Xeon, su interconexión ahora debe ser Infiniband de 10 o 100 gigas, y pronto descubrirá que el costo de un par de grandes por blade en los adaptadores de host aumenta ingerido en la construcción de telas Clos lo suficientemente profundas con interruptores que no tienen puertos suficientes …

Luego llegas a los verdaderos asesinos: poder y tiempo de actividad.

Encender las supercomputadoras es una cosa, hasta el punto de que la medida más útil ahora está en “teraflops por megavatio”. La energía, incluido el HVAC para refrigeración, distribución de energía, respaldo de energía, etc., es el gran costo de succión del alma que implica el funcionamiento de un centro de supercomputadora.

El tiempo de actividad, eso también es una cosa: proporcione una gran cantidad de núcleos (por ejemplo, no sé, 100k núcleos o más) y problemas muy complejos, las probabilidades de tener una falla en el núcleo de la CPU o una falla de memoria o alguna otra falla que explote uno de los nodos en su constelación informática está casi garantizado que significa que tiene que lidiar con eso, en tiempo real. Por lo tanto, no puede escribir software que ingenuamente asuma que todo está bien todo el tiempo, y no puede contar con el SO para saber que las cosas están bien o no porque no hay un “SO” para la constelación en su conjunto, solo para las cuchillas individuales …

Si está tratando de hacer una supercomputadora para su propio uso, encontrará que no es demasiado difícil, para alguna definición de “supercomputadora”. Si estás tratando de hacer uno para vender a otros? ¿O para atacar problemas a nivel de estado-nación? Esa es una caldera de pescado completamente diferente …

En el extremo más bajo, digamos el EFF DES Deep Crack o la máquina pi de los hermanos Chudnowsky, los cuales son adjuntos a personas inteligentes tan bajas como; $ 250,000. Estas personas saben cómo idear y pagar un VLSI personalizado que supera a los productos básicos. (Tuve que volver a escribir porciones de esto.) Cabe en un armario.

(Como mi Mac acaba de soltar una oración importante que ahora tengo que volver a escribir, las Mac no son supercomputadoras).

En el extremo superior, diga Tianhe-2 (no he visto, ni he sido invitado a ver (me rechazaron por viajar a China por trabajo); tengo 2 amigos estadounidenses que lo han visitado) o máquinas similares de alta gama: por ejemplo, Earth Simulator (más barato para construir un edificio alrededor de la computadora) u otras máquinas especializadas más allá de las granjas de servidores: más de $ xxx, xxx, xxx. (9 cifras comienzan a acercarse a 10). Estas instalaciones tienden a tener ahora no solo hardware especializado, sino que es común bromear acerca de la cantidad de unidades de disco que puede comprar: pueden arrojar las CPU de forma gratuita. Serán unidades rayadas o agrupadas, no unidades en serie. Serán más rápidos que la E / S con puerto paralelo único en sus computadoras portátiles o escritorios. Si tiene que preguntar, no puede pagar. El costo del sistema único es menos importante que el costo anual para ejecutar y mantener TODO el sistema. Es por eso que George Lucas decidió no molestarse nunca en comprar un Cray. La discusión actual que he tenido conocimiento desde hace algún tiempo es de horas exactas.

Antes de que alguno de ustedes pregunte: No, no me han invitado a ver ESE edificio en Utah. Lo he visto al otro lado de la I-15 el año pasado, lo pasaré de nuevo en un par de meses (gas barato cerca, debido a la base de la Guardia Nacional), pero he visto otra de sus instalaciones, y visitaron y copiaron aspectos de nuestras antiguas instalaciones (sus enfriadores de agua son nuestros enfriadores de agua).

Pregunte nuevamente después de noviembre. No, no es por eso que voy a Utah (amigos y familiares y estoy pasando por allí para escalar en Colorado). El viaje de noviembre es esa justificación separada.