¿Cuál es la diferencia entre MongoDB y big data?

Hadoop es una tecnología de software diseñada para almacenar y procesar grandes volúmenes de datos distribuidos en un grupo de servidores y almacenamiento de productos básicos. Hadoop se inspiró inicialmente en documentos publicados por Google que describen su enfoque para manejar grandes volúmenes de datos a medida que indexa la Web. Con la creciente adopción en toda la industria y el gobierno, Hadoop ha evolucionado rápidamente para convertirse en un complemento y, en algunos casos, un reemplazo del Almacén de datos empresarial tradicional.

Muchas organizaciones están aprovechando el poder de Hadoop y MongoDB juntos para crear aplicaciones completas de big data:

  • MongoDB impulsa la aplicación operativa en línea y en tiempo real, que sirve a los procesos comerciales y a los usuarios finales, exponiendo los modelos analíticos creados por Hadoop a los procesos operativos
  • Hadoop consume datos de MongoDB, combinándolos con datos de otras fuentes para generar análisis sofisticados y modelos de aprendizaje automático. Los resultados se vuelven a cargar en MongoDB para servir a procesos operativos más inteligentes y conscientes del contexto , es decir, ofrecer ofertas más relevantes, una identificación más rápida del fraude, una mejor predicción de las tasas de falla de los procesos de fabricación.

Antes de explorar cómo los usuarios crean este tipo de aplicación de big data, primero profundicemos en la arquitectura de Hadoop.

Mongo DB es una base de datos NoSQL. Puede contener datos estructurados y no estructurados.

Big data por otro lado es un concepto. Cuando el volumen de datos es enorme, la variedad es alta y la variabilidad es alta, entonces ese tipo de datos se denomina big data.

Bigdata es un concepto que tiene tres principios

3V

  1. Volumen
  2. Velocidad
  3. Variedad

MongoDb implementa ese concepto.