Hipotéticamente hablando, ¿qué cadena de eventos sucedería si todos los ingenieros de una empresa como Google se fueran y dejaran que los sistemas se las arreglaran solos?

Gran pregunta!

Primero, el lado del hardware. El hardware falla a menudo. Las unidades de disco comenzarían a morir lentamente y la capacidad comenzaría a disminuir lentamente. Los discos que contienen los sistemas operativos o aplicaciones de los servidores morirían, y esos servidores se apagarían. Sin embargo, la mayoría de los sistemas son redundantes, por lo que esto tomaría un poco de tiempo para tener efecto. Si los sistemas no estuvieran bajo una carga muy alta, podrían durar días o incluso semanas. Quizás meses.

A medida que las fallas afectaban a los sistemas que proporcionaban la redundancia (equilibradores de carga, fuentes de alimentación, etc.), los sistemas completos se desconectarían. Una base de datos crítica que caiga podría desconectar a toda una empresa. Un pequeño servicio interno que no funciona puede hacer que ciertas funciones no funcionen.

En el lado del software, tendría una serie de efectos:

  • Algunos sistemas deben reiniciarse regularmente por varias razones, como pérdidas de memoria o actualización del estado de la aplicación. Estos servicios se bloquearían y no volverían a estar en línea.
  • Las unidades de disco se llenarían. Los servidores que se quedan sin espacio en disco generalmente no funcionan bien.
  • Las aplicaciones se bloquean. Algunas aplicaciones se reiniciarán automáticamente, otras no.

En pocas palabras, probablemente se mantendrá por unos días o unas pocas semanas por sí solo antes de que finalmente patee el cubo. Es probable que dicho sistema pierda lentamente su funcionalidad, hasta que eventualmente nada funcione.

La compañía, aquí Google, contrataría nuevos ingenieros para reemplazar a los que quedaban.