¿Cuándo los servicios web de Amazon admitirán la computación GPU?

Amazon lo admite ahora a partir del 15 de noviembre, por extracto de http://aws.amazon.com/ec2/instan…

“Instancias de GPU de clúster

Las instancias de esta familia proporcionan unidades de procesamiento de gráficos (GPU) de uso general con CPU proporcionalmente alta y un mayor rendimiento de la red para las aplicaciones que se benefician del procesamiento altamente paralelo, incluidas las aplicaciones de procesamiento de medios y procesamiento de HPC. Mientras que las instancias de computación en clúster brindan la capacidad de crear clústeres de instancias conectadas por una red de baja latencia y alto rendimiento, las instancias de GPU en clúster brindan una opción adicional para aplicaciones que pueden beneficiarse de las ganancias de eficiencia de la potencia de computación paralela de las GPU sobre lo que se puede lograr Con procesadores tradicionales. Obtenga más información sobre el uso de este tipo de instancia para aplicaciones HPC.

Instancia extra grande cuádruple GPU de clúster
22 GB de memoria
33.5 Unidades de cómputo EC2 (2 x Intel Xeon X5570, arquitectura de cuatro núcleos “Nehalem”)
2 x GPU NVIDIA Tesla “Fermi” M2050
1690 GB de almacenamiento de instancias
Plataforma de 64 bits
Rendimiento de E / S: muy alto (10 Gigabit Ethernet)
Nombre de API: cg1.4xlarge “

Antigua respuesta al 14 de noviembre
Amazon admitirá un IaaS basado en GPU con unos pocos años como máximo. Ya han tomado medidas para admitir cargas de trabajo intensivas en cómputo / ancho de banda con la última oferta de Intel y nodos de cómputo ethernet de 10 Gb, y pasar a admitir GPU sería un próximo paso obvio (aunque ciertamente un salto de sus ofertas actuales). Realmente, esta pregunta es preguntando: ¿son las GPUs convencionales? Si lo son, entonces Amazon no estará tan lejos del soporte.

Con los gustos de Dell que ofrecen factores de forma optimizados para GPU, el uso de GPU se implementó internamente incluso en entornos relativamente convencionales, como finanzas, problemas básicos como punto flotante de doble precisión y memoria ECC ahora disponibles para GPU, se están moviendo mucho hacia la corriente principal para algunos (definitivamente no todas) aplicaciones.

Agregue a eso competidores (mucho más pequeños) a Amazon que ofrece alojamiento de GPU, es solo cuestión de tiempo antes de que Amazon haga lo mismo. Para al menos parte de la carga de trabajo intensiva de cómputo que requiere una gran cantidad de blades / capacidad de CPU, la GPU puede tener mucho sentido y el mercado que está familiarizado con las GPU estaría familiarizado con Amazon EC2.

Por último, pero no menos importante, el modelo de programación no debería ser una barrera de entrada para Amazon que implementa GPU. Si bien CUDA y OpenCL y sus respectivos patrocinadores continuarán discutiendo esto por un tiempo, el costo incremental para Amazon de admitir algunos tipos diferentes (o simplemente respaldar el más compatible) sobre su arquitectura actual no sería demasiado significativo . Si tuviéramos que mirar la historia de Amazon, admitirían algunas ofertas limitadas, pero aún muy útiles, antes de expandir esto progresivamente.

Llamo a esto como estar disponible antes de finales de 2012, con una visión exactamente nula de los planes internos de Amazon.

Cualquier servicio web no trivial (especialmente en la escala en que operan Amazon y Google) exige una gran inversión inicial de tiempo, dinero y experiencia. Esto se justifica por el retorno de la inversión. ¿Existe una buena justificación comercial para los clústeres basados ​​en GPU en este momento? ¿Hay demanda ahora?

Mi instinto me dice que no.

¿Por qué Amazon construyó AWS? Debido a que tenía experiencia, infraestructura y capacidad, podía aprovechar y vender a una amplia gama de mercados en una amplia gama de industrias. Las máquinas basadas en Linux (virtuales) ya eran bien entendidas, bien apalancadas y bien respaldadas antes de que Amazon apareciera junto con EC2. El almacenamiento de archivos tiene una historia similar (S3, EBS). Lo mismo ocurre con las colas (para SQS, consulte: el éxito de TIBCO por una buena razón por la cual las colas son importantes). Todas estas son utilidades bien entendidas con muchos conjuntos de problemas existentes para ellas.

Pero cuando se trata de la agrupación basada en GPU, el dominio del problema en sí es mucho, mucho más estrecho, y las técnicas algorítmicas para explotar GPU en masa en los llamados “niveles de nube” todavía están en su infancia, y los lenguajes y programas para controlarlas todavía están en su infancia. Además, en realidad solo hay dos grupos de personas trabajando en computación basada en GPU a gran escala tal como existe hoy en día:

  1. Investigadores
  2. Casas de renderizado

El primer grupo tomado solo no tiene el capital para justificar una inversión en computación en la nube basada en GPU (al menos no en la escala de Amazon), y * todos * los miembros del segundo grupo que vale la pena considerar ya tienen granjas de renderizado masivas propias que No sería rentable migrar a cualquier tipo de GPU-nube.

Tenga en cuenta que este no es un problema de nivel de infraestructura autónomo. Las GPU son sistemas de código cerrado. Sus controladores no son públicos, su firmware no es público y los idiomas utilizados para programarlos están estrictamente controlados por las compañías que los fabrican (NVidia, AMD / ATI). Estos idiomas son incompatibles entre sí. No se parece en nada al mercado de CPU.

¿Mi predicción? Mínimo de tres años (edición: revisado de cinco años después de pensarlo más) antes de que AWS lance un servicio en la nube para GPU. El firmware, los controladores, los lenguajes de control y los algoritmos tendrán que avanzar significativamente en este tiempo para que los servicios en la nube basados ​​en GPU sean una buena inversión.

More Interesting

¿Cuál es el principal proveedor de Cloud Point de ventas para empresarios minoristas independientes con una sola ubicación de tienda?

¿Cuáles son las principales áreas de investigación en seguridad en la computación en la nube?

¿Debo obtener un plan de alojamiento web comercial o VPS?

¿Qué es lo mejor para un entorno de desarrollador, AWS o Azure?

Telegram Messenger en su sitio web oficial mencionó que han creado esta aplicación solo para personas y que no venderá ningún anuncio y es gratis para siempre. ¿Cómo y por qué debería creer que Telegram es seguro?

¿Qué tema es mejor computación en la nube o seguridad de red?

¿Qué métodos de cifrado utilizan los proveedores de servicios en la nube para cifrar datos en reposo? ¿Cómo eligen estos métodos?

¿Qué se puede hacer para asegurarme de que no cruce el límite de uso de la capa gratuita de AWS?

¿En qué se diferencian las plataformas informáticas sin servidor como AWS Lambda o IBM OpenWhisk de PaaS?

¿Cuáles son las soluciones IaaS populares que utiliza la industria del petróleo y el gas? ¿Se subcontratan a terceros o utilizan una solución local?

¿Cuáles son las características de Cloud CRM?

¿Amazon proporciona una API para extraer los detalles de uso de la cuenta de AWS?

¿Qué efecto tendrá la nueva oferta de IaaS de Cloud Compute Engine de Google en Amazon EC2?

¿Existe alguna herramienta que pueda proporcionar administración de costos para mi infraestructura de nube pública?

¿Qué es la computación de no repudio?