tl; dr – Spanner y Hadoop no son reemplazos entre sí
Hadoop y Spanner son manzanas y naranjas, uno es un marco / modelo para procesar grandes conjuntos de datos y el otro es una base de datos, respectivamente. Hadoop no debe considerarse una base de datos
Spanner es una base de datos relacional que puede escalar horizontalmente con la semántica de MySQL. Lo que esto significa es que puede obtener soporte para transacciones ACID y escalar como lo hacen muchas bases de datos NoSQL. Spanner es altamente disponible y consistente, pero no rompe el teorema CAP como se describe en este artículo. Spanner es para aquellos que necesitan una base de datos relacional * escalable horizontalmente disponible a nivel mundial *.
- ¿Cómo se mantuvieron en el negocio empresas como YouTube e Instagram (antes de ser compradas) cuando los costos de entrega de contenido son tan altos? Incluso con dinero VC, los costos parecen mayores que el capital.
- ¿Podría Netflix migrar de AWS y a qué costo?
- ¿Qué tiene de bueno y de malo la opinión de que nos estamos moviendo a un mundo dominado por la nube inteligente + interfaz móvil tonta y barata?
- Cómo proporcionar a mis clientes un servicio confiable en la nube
- ¿Cuál es la diferencia entre un modelo de servidor cliente y la computación en la nube?
Hadoop, por otro lado, es un marco para procesar grandes conjuntos de datos. Es probable que haya confundido a Spanner para Dataflow. Google ha mencionado que muchas de las cargas de trabajo de Big Data aprovechan el flujo de datos debido a su capacidad de escalar automáticamente y eliminar la necesidad de gestión de la infraestructura. Dataflow es realmente una evolución de Hadoop. Puede leer más sobre la comparación entre Hadoop y Dataflow.
No hay nada malo o bueno, sino más bien la evolución de hadoop en un sistema que no requiere administración de infraestructura y proporciona un modelo para datos por lotes y de transmisión.
Dataflow también tiene su equivalente de código abierto, Apache Beam, como se discute en este blog.
* Diferencia entre escalar horizontal y verticalmente para bases de datos