¿Cómo maneja Google los problemas de escalabilidad en su motor de búsqueda dado que todos los días, casi todos en el mundo educado buscan en Google?

Google hace muchas cosas para garantizar una respuesta rápida en cada búsqueda.

  • Inventaron su propia tecnología de base de datos personalizada en 2004, un software diseñado para indexar páginas web y buscar palabras clave. Lo llamaron Bigtable. No es un producto que pueda usar, excepto a través de Google. Aunque desde que publicaron un documento sobre el diseño básico, se han desarrollado otros productos de software que utilizan algunos de los mismos conceptos. Estos incluyen HBase, Cassandra e Hypertable.
  • Google almacena copias de datos en múltiples servidores en múltiples centros de datos en todo el mundo. Cuando haces una búsqueda, he leído que ejecutan la consulta en varios servidores, y el primero en terminar te da la respuesta. Los otros pueden terminar una fracción de segundo más tarde, pero el resultado se descarta.
  • Google usa alrededor de 900,000 servidores (el artículo es de 2011, sin duda tienen muchos más ahora). Cada búsqueda de Google que ejecutas usa tanta potencia como encender una bombilla de 60W durante 17 segundos. Dada la cantidad de personas que realizan búsquedas todos los días, su consumo total de electricidad podría alimentar 200,000 hogares.

Hay otros logros tecnológicos que usamos todos los días que rivalizan con Google en complejidad y capacidad de respuesta instantánea, pero los damos por sentado. El sistema telefónico y la red eléctrica son bastante impresionantes.

Invierten grandes $$$.

Tienen granjas de servidores enormes en todo el mundo que admiten el tráfico de búsqueda. Esta es una imagen de solo uno de ellos:

La arquitectura lo hace escalable. Todo lo que necesitas es el dinero para hacerlo.

Y Google tiene mucho dinero de los ingresos publicitarios, como su principal fuente de ingresos.