¿Son responsables de alguna manera las empresas como Amazon Web Services cuando tienen un corte de energía?

Casi todas las compañías de renombre que ofrecen servicios de tecnología (ISP, hosting, etc.) como Amazon Web Services tendrán un “Acuerdo de Nivel de Servicio” (SLA) que describe en qué punto comenzará a recibir una compensación monetaria por cualquier interrupción. Por lo general, son bastante vagos, favorables para el vendedor, y casi seguramente no alcanzarán los números que se describen ($ 1 millón / hora, 4 horas de interrupción).

Aquí está el AWS EC2, por ejemplo, Amazon EC2 SLA Una de las frases clave es “AWS hará esfuerzos comercialmente razonables para que Amazon EC2 y Amazon EBS estén disponibles con un Porcentaje de tiempo de actividad mensual (definido a continuación) de al menos 99.95 %” Y si Si se desplaza un poco hacia abajo, notará que le reembolsarán el 10% de su factura si caen por debajo del 99.95% pero por encima del 99.0%.

El bit “comercialmente razonable” también les da una buena cantidad de libertad en términos de cuándo usted, como cliente, no puede esperar que intenten restaurar los servicios. Algunos ejemplos recientes pueden ser:

  • El huracán Sandy devastó NY / NJ y decenas de centros de datos importantes no estuvieron disponibles durante algún tiempo después de la tormenta: el huracán Sandy desconecta los centros de datos con inundaciones y cortes de energía.
  • Esto afectó a Rackspace, pero es la misma idea, una interrupción importante de energía probablemente quedaría fuera de “comercialmente razonable” – Rápido, conecte Internet nuevamente: Interrupción importante de Rackspace

Y finalmente, la matemática de lo que el 99.95% de tiempo de actividad generalmente sorprende a las personas. Si echa un vistazo a la Alta disponibilidad: Wikipedia notará que un servicio que está “activo” en un 99.95% aún puede experimentar casi 22 minutos de tiempo de inactividad por mes.

Bastante no. La responsabilidad recae en el sitio de comercio electrónico que no diseñó su plataforma para tolerar fallas de servicios externos específicos. En casos excepcionales, los acuerdos de nivel de servicio (SLA) tendrán pagos por los costos asociados con fallas. Pero con cosas como Amazon Web Services, generalmente no. (Los SLA generalmente niegan cualquier responsabilidad por daños y perjuicios).

En el caso de la interrupción del 28 de febrero de 2017 de Amazon Web Services S3 en US-EAST-1 (y tal vez una serie de servicios relacionados), generalmente hubo mecanismos que las empresas podrían haber utilizado para diseñar aplicaciones que sean resistentes a tales fallas: aunque a un costo de dólares y complejidad. De lo contrario, puede haber sido o no una decisión comercial acertada, pero las pérdidas asociadas con el comercio que depende de los servicios subyacentes rara vez se cubrirán.

No, al igual que un operador de telefonía móvil no es responsable cuando tiene un problema para hacer llamadas o su ISP tiene un problema, y ​​no puede conectarse a Internet. No creo que encuentre una compañía que sea responsable de la pérdida monetaria de otra persona. Ni siquiera los bancos. También tienen una cantidad máxima de dinero que pagarán si quiebran, independientemente de la cantidad que tenía en la cuenta bancaria. Esa garantía proviene del gobierno en la mayoría de los países.

Algunas compañías tienen un SLA. Ese es un acuerdo de nivel de servicio donde acuerdan compensar algo de dinero dependiendo de la duración de la interrupción o el problema. Sin embargo, nunca será más dinero de lo que les está pagando por el servicio. Por lo tanto, si le paga a una empresa en la nube o de hosting $ 100 / mes y afirma que acaba de perder $ 1000, en la mayoría de los casos solo le reembolsarán una pequeña parte en función del tiempo de inactividad que pagó por ese tiempo, así que en ese ejemplo unos centavos por algunas horas.

Tiene sentido, ¿verdad? Bueno, por supuesto que lo hace. De lo contrario, no habría empresas que brinden ningún servicio o le cobrarían en función de la cantidad de dinero que gane. Si desea reclamar un% de dinero perdido, entonces sería justo que le cobren una tarifa por el servicio basado en un% de lo que está ganando. Espero que veas la lógica aquí. Si está pagando $ 1000 / mes, no puede reclamar millones en la pérdida.

Si está ganando esa cantidad de dinero, entonces debe invertir una suma similar de dinero asegurándose de tener toda la redundancia y la conmutación por error que su presupuesto puede permitirse. Para volver a su ejemplo, suponiendo que un sitio de comercio electrónico esté ganando $ 1 millón por hora, puede estar seguro de que también invierten unos pocos millones al mes para impulsar el sitio web y la plataforma que les permite mantenerse en el negocio.

No, la responsabilidad recae sobre usted y la responsabilidad de diseñarla para mantener tales interrupciones.

Incluso Amazon en sí mismo no solo “cuenta” con su centro de datos subyacente para que nunca se bloquee. De hecho, los propios sitios web de Amazon no se vieron afectados por la interrupción de esta semana, no debido a alguna salsa mágica que tienen, sino más bien porque diseñaron su sistema para extenderse con una redundancia geográfica y una arquitectura resiliente adecuada para mantener dicha interrupción.

Y tú también deberías hacerlo.

Aquí hay algunas ideas y consejos útiles sobre cómo mantenerse seguro la próxima vez:

El corte en la nube de Amazon afecta a docenas de sitios, pero no a Amazon