¿Cómo es trabajar en una empresa que desarrolla y mantiene servidores de juegos de alto tráfico?

Esto depende en gran medida de la escala a la que nos referimos. El alto tráfico es subjetivo y puede definirse por una serie de métricas. Supongamos que está hablando de los mejores juegos para PC y móviles y también supongamos que nos referimos a empresas con más de 20 empleados. Lo dividiré en tres fases que atraviesa una empresa en crecimiento, ninguna de las cuales es científica y cada empresa hace las cosas de manera ligeramente diferente. Intentaré definir fases genéricas aquí:

Acceso temprano / éxito temprano

En esta fase, podemos ser una de las dos o tres personas de DevOps. DevOps es un rol especializado que es una combinación de desarrollador de software y operaciones de TI. Usted y su pequeño equipo estarían trabajando para asegurarse de que haya suficientes servidores para mantener el tiempo de actividad para el creciente número de usuarios concurrentes (CCU) que tiene su juego.

Mientras apaga constantemente incendios, también está trabajando para diseñar tantas soluciones y accesos directos a tareas repetitivas como sea posible. Espere llamadas telefónicas nocturnas y mucho tiempo preparándose para parches, actualizaciones e interrupciones.

Crecimiento sostenido

Tu juego ahora está creciendo constantemente. El equipo ha crecido significativamente, te han preguntado si quieres ser DevOps o el nuevo ingeniero de confiabilidad del sitio (SRE).

DevOps trabaja en arquitectura de servidor y herramientas para mejorar las operaciones del servidor. Esto incluye cosas como mejorar el tiempo de implementación, resolver problemas arquitectónicos y diseñar el sistema a escala.

Lo más probable es que SRE se dirija hacia un horario de guardia, con suerte nuestro turno no durará más de una semana. Como SRE, estás trabajando para obtener métricas y herramientas de monitoreo para observar el juego en vivo. Mientras lo hace, está trabajando constantemente en libros de ejecución que ayudarán a resolver rápidamente los problemas cuando surjan.

Probablemente se incluyan también cualquier número de scripts y herramientas que ayuden a recuperar rápidamente los servidores cuando las cosas se caigan o para ayudar a soportar nuevas instancias de servidores cuando sea necesario para responder a los picos en CCU.

Territorio del perro grande

Ahora que lo has hecho, tienes millones de jugadores y las personas conocen el nombre de tu empresa. Probablemente todavía esté en DevOps o SRE, pero ahora estamos trabajando mucho más en soluciones que se activan automáticamente, alertan e incluso corrigen sin intervención. Esto nunca es perfecto, pero también continúa trabajando en libros de carreras y respondiendo a incidentes.

Hablando de incidentes, SRE probablemente ahora esté en una rotación 24/7, así que espero que ya no te despierten en medio de la noche. También es posible que su empresa haya abierto oficinas más pequeñas en todo el mundo y SRE tiene equipos en una “rotación de seguir al sol”

Conclusión

DevOps y SRE son títulos populares y, sinceramente, cada empresa maneja estas cosas de manera ligeramente diferente, en el mejor de los casos. Lo principal a tener en cuenta es que hay mucho enfoque en los libros de ejecución, alertas, automatización y arquitectura de escala. En cierto tamaño, los roles se vuelven muy distintos entre aquellos que están monitoreando y arreglando artículos calientes y aquellos que se están preparando para la escala del futuro.

More Interesting

¿Cuál es la diferencia entre un dinamómetro web de Heroku y un dinamómetro de trabajo?

¿Cuál es el precio de mercado actual por megabit para una confirmación de 150 mbps que incluye la colocación (rack, alimentación y red gigabit redundante) utilizando la facturación del percentil 95?

¿Cuáles son las principales diferencias entre los servidores de aplicaciones Tomcat y Jetty?

Para los servidores de aplicaciones de Microsoft Exchange implementados en el sitio en empresas medianas y grandes, ¿cuál es la combinación en los EE. UU. Entre blades y cajas de servidores genéricos?

¿Cuál es el costo de un servidor típico por mes para ejecutar un sitio web grande (1 - 2m único)?

¿Cuál es la mejor manera de implementar una base de datos y un servidor diferentes para cada prueba en su conjunto de pruebas?

Marcos de aplicaciones web: ¿es posible ejecutar Cakephp y Tornado en el mismo servidor de fondo?

¿Cuál es una buena guía para comenzar a usar Nginx?

¿Cuáles son los beneficios de usar una plataforma IOT, como Azure, en lugar de alojar su propio servidor para registrar, manejar y visualizar datos?

¿Cuál es el mejor servidor de integración y despliegue continuo?

¿Por qué se necesita un personal dedicado para administrar un servidor?

¿Cuál es la mejor herramienta para monitorear un conjunto de servidores de Windows (memoria, CPU, E / S)?

¿Cuál es la forma de desarrollar un sistema de inicio de sesión centralizado para servidores basados ​​en Linux que utilizan SSH?

¿Dónde puedo obtener información sobre buenas tarjetas de red para servidores Linux?

¿Cuáles son los pros y los contras de usar Munin?