Esta es una pregunta complicada, sin una respuesta clara. Después de trabajar durante casi 10 años en la industria, todavía estoy aprendiendo en este frente.
Todavía intentaré responder la pregunta. Sin embargo, en lugar de una respuesta definitiva, tómalo más como un puntero.
Lo primero que hay que entender es a cuánta disponibilidad está apuntando. Por ejemplo, el 99.9% de tiempo de inactividad significa aproximadamente 43.8 minutos de tiempo de inactividad mensual. 99.99% significa 4.32 minutos de tiempo de inactividad mensual. Y 99.999% significa un tiempo de inactividad mensual de 30 segundos. Cada punto decimal agrega desafíos exponenciales.
- ¿Cuál es la mejor alternativa para alojar la base de datos de mi empresa en la nube?
- ¿Cómo limitar mis costos con el uso de la nube pública? ¿Hay alguna herramienta que pueda ayudar?
- ¿Cómo gana dinero Amazon Web Services Cloud EC2 si es gratis por 1 año?
- ¿Cuál es el significado de la Cloud Native Computing Foundation?
- ¿Hay proveedores en la nube que proporcionen solaris en SPARC?
- Hospedaje: elija un proveedor de hospedaje confiable. Si es posible 2 o 3 de ellos. Si no se separan zonas o regiones. Por ejemplo, si está en AWS, si no en regiones, separe sus instancias al menos en toda la zona disponible.
- Datos: asegúrese de que sus datos estén replicados o mejor almacenados en un entorno replicado en clúster. Asegúrese de que el número de registros y claves se pueda aumentar a cierto nivel sin derribar el sistema.
- Implementación: tiene una integración continua, tiene pruebas adecuadas, implementación y mecanismo de reversión. Asegúrese de que puede realizar la implementación sin desactivar el sistema completo.
- Escalabilidad: asegúrese de que su aplicación sea escalable horizontalmente.
- Equilibrio de carga (informática): asegúrese de tener al menos algún tipo de alta disponibilidad garantizada por el equilibrio de carga global o a nivel de DNS. O algo similar.
- Seguridad: garantizar la seguridad en varios niveles podría garantizar una mayor cantidad de tiempo de actividad.
- Otra información: las copias de seguridad, los procedimientos de restauración adecuados, la supervisión adecuada y la gestión de la configuración, la documentación adecuada, los procedimientos claros de guardia, etc., lo ayudarán a aumentar su tiempo de actividad.
He dado una perspectiva amplia, porque no hay una respuesta definitiva. Siempre habrá compensaciones, a veces entre costo, disponibilidad y rendimiento. A veces entre seguridad, conveniencia y entrega rápida. Por ejemplo, para las bases de datos, el teorema CAP es un muy buen ejemplo práctico (Nota: aquí C => Consistencia, A => Disponibilidad y P => Particionamiento).
Por lo tanto, en una perspectiva amplia, debe comprender a qué nivel de disponibilidad se dirige, qué compensaciones está listo y a qué costo. Creo que el siguiente enlace podría resultar útil:
Lista de atributos de calidad del sistema.
Gracias por A2A. Espero eso ayude.