¿Cuáles son algunos de los problemas prácticos con Big Data?

Yo diría que el problema más práctico es el teorema CAP, donde un sistema distribuido tiene que elegir 2 de

  • Consistencia
  • Una disponibilidad
  • P tolerancia de art.

El detalle importante a tener en cuenta, en mi opinión, es el siguiente (de la página de Wikipedia vinculada)

En ausencia de fallas en la red, es decir, cuando el sistema distribuido se ejecuta normalmente, se puede satisfacer tanto la disponibilidad como la coherencia.

A menudo se entiende mal el CAP como si uno tuviera que elegir abandonar una de las tres garantías en todo momento. De hecho, la elección es realmente entre consistencia y disponibilidad solo cuando ocurre una partición de red o falla; en todos los demás momentos, no se debe realizar una compensación.

Los sistemas de bases de datos diseñados teniendo en cuenta las garantías tradicionales de ACID, como RDBMS, eligen la consistencia sobre la disponibilidad, mientras que los sistemas diseñados en torno a la filosofía BASE, común en el movimiento NoSQL, por ejemplo, eligen la disponibilidad sobre la consistencia.

More Interesting

¿Por qué proceso decide si usar R o Python (Pandas) para leer y analizar grandes conjuntos de datos con formato CSV?

¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?

¿Cuáles son algunos de los principios de ingeniería de software que todo científico de datos debe conocer? ¿Cómo los aprendes?

¿Por qué la mayoría de los científicos computacionales (p. Ej. Biólogos, astrofísicos) son malos programadores según los estándares de CS?

Cómo ingresar a un programa de doctorado en ciencia de datos

¿Cómo usan las grandes organizaciones los grandes datos?

¿Cuál es la diferencia exacta entre Big Data, Data Science y Data Analytics?

¿Cuáles son las herramientas utilizadas por un analista de sistemas para organizar los datos recopilados durante el proceso de análisis?

Al igual que Mathematica, ¿existen herramientas de código abierto capaces de integrar el conocimiento con nuestros datos?

¿Qué se siente ser un científico de datos en Tesla?

¿Cómo afectan la ciencia de datos, los grandes datos y el aprendizaje automático al campo de la ingeniería biomédica?

¿Qué sigue después de la regresión múltiple para la ciencia de datos?

¿Cómo describiría la diferencia entre la gestión de información / datos y el análisis de datos?

¿Cuáles son las cosas clave que busca en una lista de trabajos de Ciencia de datos / Aprendizaje automático?

¿Cuál es la diferencia entre los datos del panel, los datos en serie de tiempo y los datos de sección transversal?