¿Cómo calculan los proveedores de Google Compute o AWS cuáles serán sus costos cuando el uso sea impredecible?

Depende mucho de qué tan estático o dinámico sea el uso del servidor y de cuántos usuarios simultáneos tenga. Pero en mi experiencia con varios servicios grandes y pequeños, realmente no se puede predecir esto de antemano. Recuerdo un caso en Adobe en el que intentamos predecir nuestros costos por adelantado para un nuevo servicio. Nuestros cálculos resultaron ser muy inexactos y muy altos.

Sin embargo, una vez que su servicio tiene algo de historia, los costos son bastante predecibles a menos que tenga un pico inesperado. Por supuesto, si está utilizando el escalado dinámico para que la cantidad de servidores crezca y se reduzca con la demanda, sus costos seguirán de cerca con la cantidad de usuarios activos y los picos realmente no deberían importar. Presumiblemente, tiene alguna forma de ganar dinero con esos usuarios activos, por lo que sus ingresos también deberían crecer y reducirse.

Hacen una serie de estimaciones (mejores, probables, escenarios máximos). Los escenarios de casos mejores y probables se utilizan para estimar el mínimo siempre en la configuración de instancia y recurso. El escenario máximo estimado se utiliza para configurar los requisitos de ráfaga (capacidad dinámica o capacidad variable) de su entorno. Los límites se definen para controlar el gasto y las alertas se configuran para notificar a los administradores para acciones adicionales. Todas estas estimaciones también tienen costos estimados.

El rendimiento del sistema se controla constantemente y estas estimaciones se ajustan y ajustan. Si se necesita más presupuesto para aumentar los límites, entonces se solicita.