Bueno, en primer lugar, la nube y Hadoop son entidades independientes que pueden existir por separado o juntas. Creo que te estás refiriendo a Hadoop aquí (tiene más sentido) y responderás de acuerdo con eso.
Una diferencia importante entre las bases de datos relacionales de antaño y Hadoop es el momento de la aplicación del esquema.
Las bases de datos relacionales requieren que todos los datos estén en tablas; por lo tanto, debe convertir los datos que recibe (de cualquier fuente) en un conjunto predefinido de tablas y columnas. Cambiar un esquema después del hecho puede ser costoso y requerir mucho tiempo. Esto se llama esquema en escritura . Primero lo extrae en el formato correcto y luego lo almacena (= cargando).
- Soy estudiante de informática en mi segundo año. Me gusta la programación y actualmente estoy aprendiendo Java después de aprender los conceptos básicos y de OOP. ¿Debo seguir dominando Java o debo usar Big Data y Cloud Computing? ¿Cuál es el mejor para mí?
- ¿Alguien puede darme un breve conocimiento sobre la computación en la nube?
- ¿Es mejor usar Google Cloud Platform en comparación con AWS en 2016?
- ¿Cuál es la mejor manera de elegir el servidor del juego?
- ¿Puedo vender el exceso de capacidad de mi cuenta de AWS al mercado de instancias puntuales, durante las horas no operativas de la empresa?
A Hadoop, por otro lado, no le importa cómo se almacenan los datos. Uno puede volcar datos en blobs binarios de cualquier formato. Tienen que escribir funciones para leer el formato cuando comienzan a procesar los datos. Esto se llama esquema de lectura . Primero está almacenando (= cargando) datos y luego extrayéndolos durante el análisis. Puede ser útil en situaciones en las que los datos no están bien formateados o no sabes cuál debería ser el mejor esquema (que es una función de cómo quieres usarlo).