¿Por qué no más académicos utilizan los servicios en la nube para la supercomputación, en lugar de comprar mini clústeres para su laboratorio?

Principalmente, solo que los servicios en la nube son caros. Después de todo, esa gran empresa en la nube no está operando una organización benéfica, por lo que sabe que está obteniendo grandes ganancias. También proporciona mucho más servicio del que realmente necesita, por ejemplo, energía protegida por UPS. Demonios, la energía podría ser realmente gratuita en la universidad, tal vez incluso el espacio y el ancho de banda de la red. Sin mencionar el factor de prestigio.

Otro factor realmente importante es el control o la autonomía. Si posee su propio hardware, nunca hay ninguna cuestión de acceso, y si no está disponible, puede abordar los motivos directamente (en lugar de esperar que alguien arregle algo en un centro de datos en Virgina).

La investigación académica es impulsada por subvenciones, que naturalmente se prestan a los costos de capital, al menos de una manera más simple que los costos operativos. Si solicita dinero operativo, debe justificar los años centrales, que es un poco más complejo de pensar que solo los núcleos. (Lo cual es otra forma de decir que, dado que, por definición, cualquier investigación innovadora es impredecible, preferiría tener recursos de un tamaño particular que pueda usar todo el tiempo, que comprometerse con un presupuesto fijo para el año central …)

Los servicios en la nube no necesariamente se escalan de manera tan eficiente como los clústeres o supercomputadores para la mayoría de los códigos científicos. Considere, por ejemplo, una aplicación de simulación computacional de dinámica de fluidos utilizada para diseñar un avión. Si lo ejecuta en un buen clúster con, digamos, 500 núcleos, no sería raro que sea 20 veces más rápido en comparación con la misma aplicación que se ejecuta en un servicio en la nube tradicional de 500 núcleos.

Incluso habrá casos en los que el mismo servicio en la nube con la misma aplicación podría funcionar más lentamente si se usan 1,000 núcleos en lugar de solo 500 (un problema típico de mala escalabilidad). Aunque este problema de “mala escalabilidad” podría (y ocurriría) también para aplicaciones que se ejecutan en clústeres y supercomputadoras, existen muchas más aplicaciones con limitaciones de escalabilidad en las nubes. Para muchas de esas aplicaciones, principalmente científicas, los servicios en la nube ni siquiera ofrecen una solución viable.

Bueno … uno sería que los servicios en la nube son increíblemente caros y puedes construir clústeres a bajo precio. En los laboratorios de investigación de las universidades, generalmente puede obtener la mano de obra de forma gratuita de CS o estudiantes similares a CS. Los servicios de clúster en un laboratorio como ese realmente quieren estar disponibles 24/7, por lo que el modelo de “nube” tampoco tiene mucho sentido.