En servicio de alta disponibilidad: cuando un servicio afirma que tiene una disponibilidad de 99.99 (4 9s), ¿qué significa? ¿Cómo se mide y rastrea? Algunos ejemplos publicados serían geniales.

Primero la terminología. La disponibilidad del 99,99% significa que durante el tiempo que el servicio ha estado funcionando, ha estado inactivo como máximo una décima parte de ese tiempo. Eso significa que, en el transcurso de un año, si un servicio ha tenido un 99.99% de disponibilidad para ese año , entonces ha estado inactivo aproximadamente menos de 53 minutos.

¿Cómo rastrean eso? Bueno, puede referirse a los registros de su servicio y anotar cada período de tiempo que el servicio dejó de funcionar y volvió a funcionar, luego haga los cálculos usted mismo. En general, usaría algún tipo de software de monitoreo.

Personalmente, he implementado varios tipos de soluciones de monitoreo. Uno era un sistema impulsado por el cliente local. Imagine cada computadora entregada en una ubicación del cliente preinstalada con un servicio siempre activo que “llama a casa” a intervalos regulares. En casa, hay un servidor que ejecuta un servlet simple que acepta estas “casas telefónicas” en forma de HTTP POST. Cada POST contiene información relacionada con las diversas cosas que se ejecutan en esa computadora, además de recursos críticos como memoria, espacio en disco y uso de CPU. Esta información se registra en una fila en la base de datos del servidor. Luego, se puede hacer una consulta para analizar, con la resolución del intervalo elegido, cuánto tiempo no estuvo disponible cada cosa en cada computadora cliente. Si una computadora cliente no telefoneó a su casa durante un intervalo, todo en esa computadora se puede denotar como no disponible.

Otra era una solución de monitoreo impulsada por el servidor implementada con un software de monitoreo de red (lo siento, no recuerdo cuál) que ejecutaba un script cada 5 minutos. Este script consultaría una página dentro de una aplicación web que proporcionara información. Luego analizaría la información para determinar qué funcionaba dentro de la aplicación y qué no. El script devolvería un código de estado al software de monitoreo que luego enviaría por correo electrónico una advertencia apropiada basada en esto. Además, el script grabó registros para cada parte de la aplicación web probada, lo que proporciona un medio para rastrear la disponibilidad / tiempo de actividad de cada parte.

Existen soluciones mucho más sofisticadas, pero estas son dos metodologías de corte y secado para obtener estadísticas de disponibilidad del servicio.

EDITAR: El crédito total para ese cálculo inicial va a Jeremy Wilson … Inicialmente tuve accidentalmente una milésima al año en lugar de una diezmilésima. Ups

Las respuestas que busca están aquí: alta disponibilidad

Básicamente, cuatro nueves son 52.56 minutos de tiempo de inactividad al año. La implicación es que el servicio en cuestión solo no estaría disponible para usar esa cantidad de tiempo en un año.

La página en http://www.uptime.is es una calculadora útil para estas cosas.

More Interesting

¿Qué grabadoras de voz IOS se pueden cargar directamente a la nube?

¿Cuál es el futuro de la computación en la nube?

¿Qué es la tecnología en la nube y la ingeniería de aplicaciones móviles? ¿Hay alguna posibilidad para lo mismo hoy?

¿Existe un servicio para consolidar e informar todo mi uso de la nube pública (AWS, Google, Azure)? Necesito visualizar mis costos y uso en un solo lugar.

¿Cuántas veces AWS ha bajado su precio? Desde su lanzamiento en 2006, AWS ha estado bajando sus precios en varios servicios como EC2 / S3 / RDS ... etc. muchas veces. Estoy empezando a perder la cuenta la cantidad de veces que ha hecho con eso ... ¿Alguien obtiene la cuenta exacta?

¿Cuál es el proceso de transferir la base de datos de una aplicación móvil desde un servicio como Parse a un backend personalizado escrito con Node o Express?

Para el entrenamiento de verano, ¿qué curso debería preferir: computación en la nube o big data?

¿Cuál es el mejor proyecto de computación en la nube que puedo hacer para mi proyecto de último año?

¿Cuáles son los principales proveedores de colocación en los Estados Unidos?

¿Cuáles son las formas en que la seguridad de los datos es administrada por la nube?

¿Cuántos servidores tiene AWS? ¿Cuántos hay en la nube pública?

Cómo iniciar sesión en una instancia de AWS ec2 creada por un script de terraform

¿Dónde puede alguien aprender todo sobre informática de alto rendimiento y supercomputadoras?

¿Cuál es la mejor manera de enviar datos desde Excel a una base de datos en la nube?

¿Por qué necesitamos PaaS? ¿El cableado tradicional del modelo de software no es lo suficientemente bueno?