¿Qué base de datos es la mejor para algo como un sitio web de StackOverflow?

Según Stack Overflow: The Architecture – Edición 2016 Stack Exchange utiliza varios productos de gestión de datos:

  • SQL Server 2008 (4 instancias)
  • Redis (2 instancias)
  • Elasticsearch (3 instancias)

Han publicado periódicamente exportaciones de datos XML (volcado de datos de intercambio de pila), lo que revela que sus datos de contenido son bastante simples y claramente relacionales.

En realidad, supongo que tienen otros datos que utilizan para respaldar su sitio, ejecutar anuncios, rastrear usuarios, etc. Pero probablemente esto también sea relacional. Simplemente no publicado en su contenido de exportación.

Se puede usar cualquier base de datos relacional para los datos que vemos en el volcado de datos de Stack Exchange. Dudo que cualquier base de datos relacional sea inherentemente mejor que otras para este propósito. Pero cualquier base de datos, relacional o no relacional, requiere un ajuste cuidadoso para la gestión de recursos, la confiabilidad, etc.

He cargado el volcado de datos de Stack Exchange en MySQL cuando quiero consultarlo o usarlo para probar.

Mysql o postgres. stackoverflow es altamente relacional.