¿Cuáles son algunos de los problemas prácticos con Big Data?

Yo diría que el problema más práctico es el teorema CAP, donde un sistema distribuido tiene que elegir 2 de

Consistencia
Una disponibilidad
P tolerancia de art.

El detalle importante a tener en cuenta, en mi opinión, es el siguiente (de la página de Wikipedia vinculada)

En ausencia de fallas en la red, es decir, cuando el sistema distribuido se ejecuta normalmente, se puede satisfacer tanto la disponibilidad como la coherencia.
¿Por qué es tan importante el Big Data?
¿Se puede confiar en los datos autoinformados?
¿Debería cada científico de datos crear su propia red neuronal al menos una vez?
¿Qué tipo de aprendizaje automático debo usar para la clasificación de varias clases si la longitud de mi entrada es diferente en cada ejemplo de entrenamiento?
¿Qué son los datos en bruto en las estadísticas?

A menudo se entiende mal el CAP como si uno tuviera que elegir abandonar una de las tres garantías en todo momento. De hecho, la elección es realmente entre consistencia y disponibilidad solo cuando ocurre una partición de red o falla; en todos los demás momentos, no se debe realizar una compensación.

Los sistemas de bases de datos diseñados teniendo en cuenta las garantías tradicionales de ACID, como RDBMS, eligen la consistencia sobre la disponibilidad, mientras que los sistemas diseñados en torno a la filosofía BASE, común en el movimiento NoSQL, por ejemplo, eligen la disponibilidad sobre la consistencia.

Análisis deBig DataCiencia de datosdatos

Related Content

Si mis datos consisten en Hosts e Invitados, ¿cómo estructuraría la base de datos para que no termine con una gran cantidad de datos duplicados?

¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?

¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?

¿Qué son los patrones ocultos en big data?

¿Cómo es ser un científico de datos en Nike?

¿Cuál es la mejor manera de hacer un curso sobre big data en India?

¿Tener demasiados juegos en tu PC causa caídas de FPS?

More Interesting

¿Por qué proceso decide si usar R o Python (Pandas) para leer y analizar grandes conjuntos de datos con formato CSV?

¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?

¿Cuáles son algunos de los principios de ingeniería de software que todo científico de datos debe conocer? ¿Cómo los aprendes?

¿Por qué la mayoría de los científicos computacionales (p. Ej. Biólogos, astrofísicos) son malos programadores según los estándares de CS?

Cómo ingresar a un programa de doctorado en ciencia de datos

¿Cómo usan las grandes organizaciones los grandes datos?

¿Cuál es la diferencia exacta entre Big Data, Data Science y Data Analytics?

¿Cuáles son las herramientas utilizadas por un analista de sistemas para organizar los datos recopilados durante el proceso de análisis?

Al igual que Mathematica, ¿existen herramientas de código abierto capaces de integrar el conocimiento con nuestros datos?

¿Qué se siente ser un científico de datos en Tesla?

¿Cómo afectan la ciencia de datos, los grandes datos y el aprendizaje automático al campo de la ingeniería biomédica?

¿Qué sigue después de la regresión múltiple para la ciencia de datos?

¿Cómo describiría la diferencia entre la gestión de información / datos y el análisis de datos?

¿Cuáles son las cosas clave que busca en una lista de trabajos de Ciencia de datos / Aprendizaje automático?

¿Cuál es la diferencia entre los datos del panel, los datos en serie de tiempo y los datos de sección transversal?

Web Analytics