La pregunta es “para qué”? ¿Qué es lo que estás tratando de lograr? Expresaste la escala pero no el propósito. Debe elegir las herramientas con mucho cuidado en comparación con sus objetivos.
¿Redis sería lo suficientemente bueno para FB / AZ? Es difícil saberlo, pero creo que sí. No me sorprendería si ya lo usaran, por supuesto. Pero “¿a qué escala?”, No estoy seguro.
Con respecto al “volumen” de datos, probablemente Redis pueda manejar su carga. Si necesita “más” datos y tiene “muchos” servidores, también puede escalar redis a través de clústeres. Redis es en general muy sólido.
- ¿Cómo es IIM Calcuta para el programa avanzado en ciencia de datos, curso de certificación de 1 año? ¿Es mejor que el curso ISB Hyderabad y IIITB PGD en análisis de datos?
- ¿Debo hacer un master en ciencia de datos o ir a un campo de entrenamiento?
- Actualmente hay cuatro idiomas para escribir aplicaciones de Big Data: Scala, R, Python y Java. ¿Cuál usar para las aplicaciones de Big Data?
- ¿Dónde debo unirme para la capacitación en ciencia de datos?
- Cómo usar Simplescalar para crear un proyecto de ciencia de datos
Ahora, otras opciones que serían “aceptables” para Facebook o Amazon para conjuntos de datos “grandes” en “muchos” servidores (teniendo en cuenta que mencionó a esos dos grandes personajes debido a la escala de lo que intenta lograr), también podría considerar :
- Cassandra para series temporales no críticas escalables horizontalmente
- Kafka para colas de mensajes muy muy escalables
Hay más, pero creo que necesitaría más información sobre lo que intenta lograr primero.
Última palabra: piense “escalabilidad” temprano, pero no diseñe “Facebook” desde un enfoque de arriba hacia abajo. Resuelva el problema que tiene primero y elija las herramientas adecuadas para los problemas correctos.
Además, “millones de datos” no son “datos muy grandes”. A menos que “millones de datos” signifique “millones de tablas” en un mundo RDBMS.