¿Cuáles son las diferencias entre una supercomputadora y una informática distribuida (como Amazon Cloud o Google Data Center o Hadoop)?

Hasta hace aproximadamente dos décadas, para el cálculo “serio”, usaría una sola máquina monolítica para hacer todo su cálculo (como Cray 2: http://en.wikipedia.org/wiki/Cray-2). Estas máquinas usaban diseños personalizados para casi todo: memoria, procesadores, buses, etc. Eran increíblemente potentes, pero increíblemente costosos. Debido a que eran monolíticos, eran muy fáciles de programar: era como una computadora normal, excepto que es realmente potente.

Luego, la gente comenzó a darse cuenta de que se podía juntar un montón de máquinas normales y usar equipos de red de alta velocidad para producir una cantidad similar de potencia de procesamiento. Luego, lo hace mucho más rentable, aunque introduce complejidad.

Aquí hay un ejemplo de un sistema que construí en 1997 que era un montón de máquinas unidas para funcionar como una supercomputadora:


Necesitaba tanto poder para terminar los experimentos para mi doctorado. De lo contrario, habría costado $ 500,000 más o menos utilizando un diseño de “supercomputadora”. En cambio, esto me costó alrededor de $ 60,000 para construir. Cada caja en el estante es más o menos una máquina estándar: cada caja costaba ~ $ 3,000.

Entonces, todo el campo cambió y comenzó a usar el mismo procesamiento, buses, etc. que se usaban en máquinas normales.

No puede comprar una sola supercomputadora lo suficientemente grande como para servir la cantidad de datos que sirve Google. Tal vez podría reemplazar cada 1,000 máquinas que Google tiene con una supercomputadora. Pero eso seguiría siendo cientos de supercomputadoras.

¿Podrían atender las consultas de Google? Sí, podrían: las supercomputadoras tienen todas las capacidades de una computadora normal. ¿Sería rentable? De ninguna manera. Tendría un aumento del costo de 10x a 100x.

Trabajé en un pequeño súper laboratorio de computación en la universidad.

Ya son más o menos lo mismo, solo configurados de manera un poco diferente.

Te encuentras con un problema de tipo paradoja de Teseo aquí. Si reconfigura una súper computadora para ejecutar búsquedas en Google, ¿sigue siendo la súper computadora que era? Las supercomputadoras suelen ejecutar cargas de trabajo súper paralelas donde cada nodo realiza la misma tarea con un conjunto de datos diferente. Tendría que cambiar la topología de la red, cambiar la configuración de almacenamiento, etc. Google ya podría localizar fácilmente la totalidad de su potencia informática en un solo centro de datos. ¿Un centro de datos de Google existente ya cuenta como una supercomputadora?

More Interesting

Teoría de la complejidad computacional: ¿Encontrar todos los nodos en una red es un problema NP conocido?

Si el mundo tal como lo observamos fuera realmente una simulación interactiva (como se sugiere en ciertas películas de ciencia ficción), ¿qué tipo de potencia informática se necesitaría para ejecutarlo? ¿Cuánto poder dibujaría?

¿Un servidor simple con un servidor MS SQL siempre vencerá a uno virtual?

¿Cuáles son ejemplos de problemas que se creía que eran NP completos pero que en realidad son P?

¿Almacenar varias claves por nodo, como en B, B + Árboles, es un concepto válido?

¿Ha cambiado la reputación del Reino Unido en el mundo debido al Brexit?

¿Cómo deberíamos pensar en el aprendizaje automático y la IA? ¿Qué tan útil es la prueba de Turing?

Si la educación en informática hoy en día es tan fácil de acceder (MOOC, libros electrónicos gratuitos, etc.) ¿por qué no vemos otro Bill Gates / Larry Page / Jeff Bezos?

¿Por qué una tubería más profunda podría traer velocidades de reloj más rápidas?

¿Existe un procesador de red neuronal de la vida real similar al de Terminator?

¿Cuál es el mejor método de aprendizaje automático para predecir el tiempo de una observación dada?

¿Cuál es la diferencia entre ip de origen y ip de destino?

Informática: ¿Cuál es la relación entre el modelo tópico y el modelo de inclusión de palabras, algún ejemplo?

¿Cuál es el significado de los códigos estabilizadores?

¿Un curso de CS es fácil o difícil?