¿Big Data es una gran BS?

Esa es realmente una buena pregunta. Probablemente la autoridad más citable sobre el tema es Nicolas Taleb (ver, por ejemplo, este artículo sobre Wired – Cuidado con los grandes errores de ‘Big Data‘ – así como su libro de 2012 Antifragile: Things That Gain from Disorder (Incerto): Nassim Nicholas Taleb: 9780812979688: Amazon.com: Libros). Algunas conclusiones:

  • Cuantos más datos recopile, más ruido (datos sin sentido) recopilará. Siempre es realmente difícil distinguir la señal y el ruido, y no se garantiza que solo obtener más datos haga el trabajo.
  • Por el contrario, si muestreas la misma fuente de datos con demasiada frecuencia o demasiado cerca, la relación señal / ruido empeorará . Piense en un sismómetro que siempre está en movimiento; la mayoría de estos movimientos no tienen sentido, y no tiene sentido prestarles atención, solo a los picos realmente grandes e infrecuentes.
  • Otra consecuencia de los grandes datos es tener demasiados observables simultáneos, lo que hace que sea ridículamente fácil dibujar correlaciones espurias. En esto, vea las maravillosas 15 cosas locas que se correlacionan entre sí.

Para colmo, citando el artículo de Wired, “Big data puede decirnos qué está mal, no qué está bien”.

Te daré 2 ejemplos de muchos otros sobre lo que Big Data puede hacer por la humanidad “YES Humanity”:

  1. Algoritmo predice los ataques al corazón 4 horas antes de los médicos – Big Data Made Simple – Una fuente. Muchas perspectivas

Entonces, los médicos tienen muchas posibilidades de reaccionar antes de que ocurra el ataque cardíaco
2. Grandes datos para predecir accidentes en tierra, tsunamis y otros desastres naturales – Predictive Analytics Today

Espero que eso te ayude.

Honestamente, no creo que sea una gran mierda. El análisis de datos ha existido durante siglos y se mantendrá. Con el avance de la tecnología de computación, solo encontraremos formas más novedosas de analizar datos y estudiar problemas con un ángulo diferente. Pero sí estoy de acuerdo en que hay cierto factor de exageración en la convergencia de los medios actuales que convierte cualquier cosa con etiqueta de “big data” en algo mágico y, para mí, es exagerado.