¿Cómo impactará la interrupción de AWS en abril de 2011 en el futuro de la nube, el futuro negocio de AWS de Amazon y los futuros clientes empresariales confiados en la nube?

Hay dos caminos hacia la alta disponibilidad: asegúrese de que cada componente (hardware y software) sea robusto (lo cual es costoso); o adopte componentes económicos y propensos a fallas y diseñe una arquitectura tolerante a fallas.

En el primer enfoque, la probabilidad de que todo el sistema permanezca activo es el producto de las probabilidades de que cada uno de los componentes individuales permanezca activo. Es difícil construir sistemas complejos confiables de esta manera.

El último enfoque es difícil, pero es la única forma de construir sistemas realmente complejos con alta disponibilidad. Los usuarios de AWS que adoptaron múltiples zonas de disponibilidad y el almacenamiento redundante pudieron seguir atendiendo a los clientes. Los usuarios de AWS que portaron una arquitectura clásica en la zona afectada sufrieron las consecuencias.

La falla de AWS fue desafortunada, pero no más allá de los criterios de diseño que los usuarios de AWS deberían haber anticipado . O bien, ese es un SLA aceptable para transmitir a sus usuarios, o usted diseña para aprovechar las características que permiten la creación de redundancia para llegar al nivel requerido.

AWS es un maravilloso campo de juego de componentes avanzados que facilitan la construcción de arquitecturas redundantes: múltiples zonas de disponibilidad, replicación automática de almacenamiento redundante (S3), almacenamiento de datos sin SQL (SimpleDB), equilibradores de carga redundantes, escalado automático, etc.

No es que sea fácil para los arquitectos acertar. Se necesitaría una arrogancia extrema para afirmar que debido a que sobrevivimos en gran medida a abril, lo hicimos bien, o sobreviviremos a la próxima interrupción. Pero estoy seguro de que estamos en el camino correcto con el enfoque de buscar cuatro nueves adoptando dos componentes de nueve nueves con una arquitectura tolerante a fallas.

No va a afectarlo mucho. La gente sigue preguntándome si Quora se queda con Amazon a pesar de la interrupción. Por supuesto que nos quedamos. ¿Qué más haríamos? ¿Pasar a un competidor de AWS que es aún peor? ¿Contratar a un equipo de operarios y pasar meses configurando un color antiguo que sea aún menos confiable y que limite severamente nuestro desarrollo? ¿Configurar una “nube privada” y obtener la mayoría de las desventajas de un colo sin la flexibilidad de AWS?

Nos hemos asegurado de que somos mucho más redundantes dentro de AWS y estamos listos para mudarnos si los problemas persisten o empeoran, pero lo único que puede quitarse de “la nube” de esta interrupción es que Amazon tiene tal gran ventaja en su competencia de que pueden darse el lujo de tener un tiempo de inactividad y sobre todo salirse con la suya. El tiempo de inactividad fue una oportunidad para las empresas amenazadas por la nube de difundir dudas al respecto, pero la tendencia macro continuará avanzando.

La aviación no murió a pesar de que los primeros aviones se estrellaron mucho.

La nube es una tendencia fundamental a largo plazo. Si Amazon cerrara mañana, el movimiento hacia la nube continuaría.