¿Qué tan grande es Google Cloud Storage en términos de capacidad de almacenamiento?

El mes pasado, ExtremeTech te reveló la verdadera escala de la pornografía en Internet. En cualquier momento, la transmisión de videos para adultos probablemente utiliza alrededor del 30% del ancho de banda total de Internet, lo que equivale a alrededor de 6 terabytes de pornografía que se consumen cada segundo . ¿Pero qué pasa con el otro 70%? Netflix, YouTube y otros sitios de video no para adultos son enormes cerdos de ancho de banda, posiblemente representando hasta el 40% del tráfico de Internet. Los archivadores digitales, como Rapidshare y Megaupload, representan alrededor del 10% del tráfico en todo el mundo. La navegación web y el correo electrónico (¡y el spam!) Son otro 15%. Y luego está la computación en la nube.

Hoy, la gran mayoría de los sitios y servicios web están alojados en la nube. Con esto quiero decir que, en lugar de empresas (como Ziff Davis / ExtremeTech) que gestionan su propio hardware, se utilizan servicios informáticos y de almacenamiento en la nube de terceros. Amazon Web Services (AWS), Microsoft Azure y Google son tres ejemplos destacados de grandes grupos de nubes, pero hay cientos de operaciones más pequeñas que varían en tamaño desde un centro de datos completo hasta unos pocos bastidores.

El poder de la nube se basa en el hecho de que puede ser forzado y forzado a realizar tareas tan dispares como una supercomputadora basada en la nube, el correo web o el simple almacenamiento de documentos. En un solo clúster en la nube, Google puede alojar y servir petabytes de videos de YouTube y almacenar todos sus correos electrónicos y documentos. Sin embargo, de todas las facetas de la nube, hoy nos vamos a centrar en el almacenamiento en la nube.

Un centro de datos de Microsoft

Si bien el almacenamiento puede no ser tan atractivo como los terabytes de RAM y miles de núcleos de CPU, es la forma más confiable de medir el tamaño de la nube, especialmente cuando tenemos en cuenta el uso del ancho de banda. A partir de la cantidad total de almacenamiento, también podemos calcular el costo del almacenamiento en la nube, y a partir de ahí, finalmente podemos averiguar por qué Google, Microsoft y Dropbox están cayendo sobre sí mismos para proporcionar servicios de almacenamiento en la nube.

Al igual que la historia porno, primero comenzaremos con algunos números teóricos y luego pasaremos a algunas figuras del mundo real (y hardware) de Backblaze, un proveedor de respaldo en la nube.

Petabytes

En su mayor parte, los números reales de las grandes empresas, como Google, Facebook, Amazon y Microsoft, son pocos y distantes. Sin embargo, si recorre la web, surgen algunas cifras aproximadas:

  • Facebook, en su presentación de IPO, dijo que almacena más de 100 petabytes (PB) de medios (fotos y videos). No es poco realista decir que Facebook probablemente tenga un almacenamiento total de capacidad mucho más allá de eso, una vez que tenga en cuenta las copias de seguridad y otros datos (actualizaciones de estado, me gusta, etc.), posiblemente en el rango de 300 PB.
  • Microsoft admitió recientemente que Hotmail almacena más de 100 petabytes y que SkyDrive, con “17 millones de clientes”, almacena 10 PB de datos. Al igual que Facebook, la capacidad total de Microsoft, una vez que tenemos en cuenta el resto de Azure y sus propiedades web, es probablemente más de 300 petabytes.
  • Megaupload es relativamente pequeño en comparación, aparentemente almacena solo 25 petabytes.
  • Amazon, en lugar de darnos una cantidad fácil y agradable de petabytes, anuncia el número total de objetos almacenados por su servicio de almacenamiento en la nube S3. A partir de abril de 2012, Amazon S3 almacenaba 905 mil millones de objetos. Si suponemos un tamaño promedio de 100 KB, eso es alrededor de 90 petabytes; si el tamaño promedio es de 1 MB, son 900 petabytes, ¡casi un exabyte!
  • Dropbox, hace un año, almacenó “más de 10 petabytes” de datos. Tenía 25 millones de usuarios en ese momento y 100 millones de usuarios en la actualidad, por lo que, en igualdad de condiciones, la compañía ahora almacena alrededor de 40 PB de datos.

Para poner estas cifras en perspectiva, una computadora promedio probablemente tiene un disco duro de 500GB o 1TB, y un petabyte es 1024TB. Por lo menos, entonces, los centros de datos de Microsoft y Facebook albergan más de 100,000 discos duros. Sin construir hardware personalizado, puede comprimir 48 unidades en un gabinete de 4U. Después de tener en cuenta el equipo de red, eso significa que probablemente esté viendo alrededor de 400 discos duros por rack de 40U, o 250 racks, cada uno de los cuales ocupa alrededor de un metro cuadrado de espacio en el piso. Esto puede parecer mucho, pero cuando considera que Google, Amazon, Facebook y Microsoft implementan regularmente centros de datos con planos de más de 30,000 metros cuadrados (más de 300,000 pies cuadrados), en realidad no es tanto. En la gran escala de las cosas, se dedica mucho más espacio a los servidores (es decir, CPU) y equipos de red.

Banda ancha

En cuanto al ancho de banda, tenemos aún menos datos de los grandes. Sabemos que, a partir del año pasado, se guardaban un millón de archivos cada cinco minutos, por lo que hoy, con cuatro veces más usuarios, eso es 800,000 archivos por minuto. Amazon S3, que es significativamente más grande que Dropbox, maneja “650,000 solicitudes por segundo”.

Si suponemos que el archivo promedio almacenado en Dropbox es de 500 KB (una combinación de fotos, videos y documentos), Dropbox almacena un total de 400,000 megabytes (0.4TB) por minuto, o 6.7GB por segundo (54Gbps). No tenemos ningún dato sobre la cantidad de datos que Dropbox envía por minuto (es decir, personas que descargan archivos de su Dropbox), pero probablemente sea del orden de 10 a 20 Gbps.

Amazon S3, que se utiliza principalmente para almacenar archivos estáticos para sitios web (imágenes, hojas de estilo, videos), probablemente tenga un tamaño de archivo promedio más bajo que Dropbox. Si suponemos un tamaño promedio de 100 KB por archivo, entonces 650,000 solicitudes por segundo equivalen a un total de 61 gigabytes de datos transferidos por segundo, o 488 Gbps. Esto está muy cerca de la cifra de 800 Gbps que estimamos para un sitio porno grande, lo que equivale a alrededor del 2% del tráfico total de Internet: ¡Amazon es bastante grande!

Facebook y Microsoft, con entre 100 y 300 PB de almacenamiento cada uno, probablemente se encuentren en algún lugar entre Dropbox y Amazon en términos de uso de ancho de banda, tal vez 200 Gbps por pieza.

Google no comparte su capacidad total, sin embargo, al ritmo en que se están expandiendo (dos nuevas regiones en los últimos dos meses), y también teniendo en cuenta que todo el hardware de su servidor está hecho a medida solo para sus centros de datos, también podría considerarlo ser infinito Cualquier cifra estática actual se verá empequeñecida en poco tiempo a la tasa de expansión.

More Interesting

¿Los datos son 100% seguros en la nube?

¿Puede la computación en la nube ser útil en la enseñanza en el aula de la escuela?

¿Cuáles son los pros y los contras de usar una base de datos relacional auto operada en una máquina virtual en la nube frente a un servicio administrado por un proveedor en la nube?

¿Quiénes son algunos de los grandes competidores para el negocio en la nube de AWS?

¿Cómo difieren el medio de almacenamiento y el dispositivo de almacenamiento?

¿Qué algoritmo se puede usar para el sistema de enrutamiento de tráfico en Cloud Computing?

¿El almacenamiento en la nube será una tecnología en auge en el futuro?

¿Qué criterios debo tener en cuenta al decidir qué servicio / software en la nube comprar?

Para una audiencia no técnica, ¿puede describir cómo los servicios en la nube de autoservicio como AWS & Rackspace han transformado el mundo de TI en los últimos 10 años?

Servicios en la nube: ¿Cuál es la mejor manera de almacenar y compartir sus archivos en línea? ¿Dropbox, Sugarsync, Google drive, Skydrive o cualquier otro?

¿Cuál es el mejor alojamiento en la nube para el desarrollo de sitios web?

¿Cuáles son los beneficios de Cloud Services for Business?

¿Qué es la computación en la nube? ¿Cuáles son las opciones de carrera disponibles en el campo mencionado?

¿Hay alguna manera de ejecutar un script solo una vez, al actualizar varias instancias en una pila de formación de nubes?

¿Qué es la 'nube' en el mundo tecnológico?