Sugiero leer algunos documentos sobre cómo Google distribuye su almacenamiento. Hay documentos similares de Facebook y Netflix.
Algunas anécdotas de casos muy simples:
- LLUVIA, no RAID
- Los fragmentos no se basan en partes de archivos, sino más bien en archivos completos.
- Los servidores de metadatos también deben distribuirse
- Separe las ubicaciones de metadatos y archivos de los servidores de datos reales
- Paralelo Estás distribuyendo de todos modos. Piensa torrentes.
- ACID es difícil de hacer en un nivel distribuido, por lo tanto, realice actualizaciones de área amplia en lote entre zonas geográficas y solo en los cambios
- Dirija a los clientes a granjas de aplicaciones geo-locales en función de su ubicación; DNS es tu amigo. Sincronizar en lotes.
- La compresión es asombrosa
- Tablas hash distribuidas
- BigTable, HDFS, Lustre (de antaño) son ejemplos instructivos. También lo es GlusterFS y su configuración. Cassandra también es un caso de estudio interesante.
- ¿Cuál es la diferencia entre el servicio web (es decir, gmail.com) y el servicio en la nube? ¿Podría tratarse el servicio web como un ejemplo particular de servicio en la nube?
- ¿En qué situaciones es Cloud Hosting una mejor opción que los servidores dedicados o los servidores virtuales?
- ¿Cuáles serían los principales pasos y análisis necesarios para migrar aplicaciones de un sistema heredado (Mainframe) a la nube?
- Cómo configurar un servidor Jump en azul
- ¿Cómo compararía las capacidades (por ejemplo, la pila de software) de Alicloud versus AWS?