¿Cuál es una utilización típica de un centro de datos en la nube? ¿Cuánta capacidad está reservada para las horas pico?

La respuesta simple es: no hay una: “utilización típica” o capacidad reservada típica.

También cambia con el tiempo y la escala. Veamos algunos extremos para ilustrar el punto. Tener un 10% de “disponible” cuando hay algunos clientes que usan, por ejemplo, 100 núcleos en total, no es una cosa terriblemente útil. Un nuevo cliente podría pedir más de lo que tiene disponible, y usted pierde dinero al no poder suministrarlo. ¿Tal vez una capacidad extra del 50 o 100% sería una buena idea?

En el otro extremo del espectro, si tienes un millón de clientes que usan mil millones de núcleos, tener un 50 o 100% extra sería una locura.

Mathew Lodge lo expresa mejor a continuación, esta es una palanca de ganancias. Riesgo versus recompensa. ¿Cuánto está dispuesto a pagar para tener capacidad disponible en caso de que un cliente lo solicite? Recuerde, no es solo CapEx (dinero para comprar servidores), sino OpEx (cuidado y alimentación) para garantizar que estén disponibles en cualquier momento.

Cada empresa toma sus propias decisiones. Y buena suerte a ellos. No es una decisión fácil. Y todo lo que cualquiera puede decir al respecto es: Estás equivocado. Cualquiera que sea el número que elija, será alto o bajo, pero no correcto.

Mi objetivo personal es estar en el lado alto (capacidad extra), pero lo más cerca posible de la “derecha” sin dejar de estar por encima de la línea.

¿Cual es tu meta?

Depende de la escala de su nube, su tasa de crecimiento y en qué etapa se encuentre como negocio.

A medida que los clientes aceleran los servidores y la nube se vuelve más madura, también hay clientes que reducen los servidores, por lo que una buena manera de calcular cuánto equipo necesita es el tiempo de entrega en la adquisición, así como la tasa de crecimiento general y los picos potenciales en la utilización, como un% de su despliegue total.

A medida que aumenta el número de servidores que tiene, los picos de utilización se vuelven menos severos porque, en porcentaje, comienza a tener mucho más equipo en espera.

El otro factor es el espacio del centro de datos que tiene también. Ya sea su ubicación o una instalación que construyó y la cantidad de dinero que está invirtiendo en hardware antes de recuperar el costo de su equipo.

Los otros factores son la salud general del negocio, aquí Google puede invertir literalmente miles de millones sin recuperar inicialmente ese costo, ya que este es un negocio nuevo que están creciendo y que se financia con la gran cantidad de efectivo que han acumulado de su negocio publicitario.

También hay otros factores en juego, como la compra directa frente al arrendamiento y la deuda, y cómo se estructura ese reembolso junto con la entrega y la adquisición de los proveedores.

Desafortunadamente, no existe una fórmula que funcione para todos, ya que todos estos factores deben tenerse en cuenta para determinar cuál es el nivel óptimo de inventario de reserva para tener en espera que puede dar cuenta de los picos en la utilización sin asumir una gran deuda o gasto en su balance que no puede capitalizar. Y, de nuevo, todo eso se puede tirar por la ventana cuando está haciendo crecer un negocio a escala de Google y tiene miles de millones en efectivo en los libros y donde la peor situación posible es tener la nube llena y no satisfacer la demanda de los clientes.

Hacer esto bien es increíblemente difícil y se considera altamente patentado porque es una palanca de ganancias. Puede pasar mucho tiempo en análisis y heurística y aún quedarse sin horas pico ( http://readwrite.com/2012/04/26/ …)

Las instancias de precio spot son una forma de llenar de manera oportunista la capacidad no utilizada. Pero la mayoría de las personas no pueden escribir aplicaciones que funcionen bien con el cómputo que podría desaparecer en cualquier momento. Sin embargo, los historiales de precios al contado pueden decirle mucho sobre cómo varía la capacidad con el tiempo para un grupo específico de hardware en un centro de datos determinado.

La tasa de reposición está relacionada con la tasa de llenado y el tiempo de entrega de la adquisición. Por lo tanto, en nuestras instalaciones comenzamos a realizar pedidos al 70% porque se tarda aproximadamente 2 meses en obtenerlos.