¿Quiénes son los principales actores en la computación de alto rendimiento en la nube (HPC)?

En cuanto a hardware, HPC tiene dos ligas diferentes. En la liga superior, están las supercomputadoras “el dinero no importa”, ubicadas en las regiones superiores de la Página de inicio | Sitios de supercomputadora TOP500. Estas computadoras generalmente están diseñadas y hechas a medida para una carga de trabajo específica (generalmente cosas militares secretas, como simulaciones nucleares, modelado climático, etc.) a partir de componentes estándar, como chips Xeon y GPU NVIDIA, pero hay algunos excepciones, por supuesto, con CPU y arquitectura de diseño personalizado.

Y luego está el resto, las “supercomputadoras comerciales”, hechas para institutos financieros, corporaciones de petróleo / gas, etc. Estas supercomputadoras están hechas por grandes proveedores de servidores internacionales, principalmente IBM y HP.

HPC no necesariamente es igual a las supercomputadoras, por supuesto. La mayoría de las máquinas HPC están formadas por servidores Dell o HP o Fujitsu (etc …), con procesadores Intel Xeon, NVIDIA o GPU AMD. El almacenamiento y las redes son entregados por sus respectivos fabricantes (Dell / EMC, NetApp, etc. para almacenamiento, Cisco y otros para red). El software basado en Linux es el sistema operativo habitual.

Puede obtener especificaciones detalladas de hardware de las diversas máquinas en Inicio | Sitios de supercomputadora TOP500. Como muchos de estos monstruos son operados en universidades e instituciones públicas, creo que puede profundizar y obtener información detallada de los respectivos propietarios. Además, hay muchas fuentes de información relacionadas con HPC en la web, con un poco de Google / Bingig, puede investigar un poco más :).

Mi empresa UberCloud [1] ayuda a ingenieros y científicos a usar Cloud HPC. Hemos existido desde 2012 y operamos en la gran plataforma informática de Microsoft Azure. Azure tiene GPU NVIDIA, interconexiones InfiniBand y el hardware especializado que exige HPC. UberCloud proporciona la capa de software que incluye la aplicación ISV.

Para obtener los beneficios reales de Cloud HPC, debe pensarlo un poco diferente que un clúster local. Aquí hay algunas cosas que Cloud HPC le permite hacer:

  1. Crea y destruye clústeres de HPC. (es decir, tratarlos como desechables).
  2. Ejecute 1000 núcleos durante 10 horas. O 10 núcleos por 1000 horas.
  3. Modele escenarios hipotéticos.
  4. Ejecute una gran cantidad de análisis paralelos.

Simplemente recrear su flujo de trabajo local en la nube probablemente no sea la mejor manera de hacerlo. En cambio, encuentre un proveedor de HPC en la nube que le permita usar la nube para sus mejores funciones. Estos son escalabilidad a pedido, pago por uso y TI tercerizada.

Notas al pie

[1] TheUberCloud

Aunque la mayoría de los proveedores de nube ahora ofrecen servicios para HPC a través de la nube, la mayoría de los clústeres de HPC continúan residiendo en las instalaciones de datos en el sitio. Hay un par de razones para eso

  1. Rendimiento y escala (arrendamiento, metal desnudo, requisito h / w)
  2. Desafío para mover datos dentro / fuera del clúster (enlace de E / S de red)
  3. Costo (esto se debate pero es difícil de probar uno sobre otro)

También hay algunos proveedores que ofrecen capacidades informáticas básicas como la informática pingüino.

Para HPC tradicional, donde necesita interconexiones de alta velocidad, pruebe la compañía Nimbix.

Para vergonzosamente paralela, Amazon Web Services probablemente está por delante de los otros servicios en la nube.