¿Big Data es una gran BS?

Esa es realmente una buena pregunta. Probablemente la autoridad más citable sobre el tema es Nicolas Taleb (ver, por ejemplo, este artículo sobre Wired – Cuidado con los grandes errores de ‘Big Data‘ – así como su libro de 2012 Antifragile: Things That Gain from Disorder (Incerto): Nassim Nicholas Taleb: 9780812979688: Amazon.com: Libros). Algunas conclusiones:

Cuantos más datos recopile, más ruido (datos sin sentido) recopilará. Siempre es realmente difícil distinguir la señal y el ruido, y no se garantiza que solo obtener más datos haga el trabajo.
Por el contrario, si muestreas la misma fuente de datos con demasiada frecuencia o demasiado cerca, la relación señal / ruido empeorará . Piense en un sismómetro que siempre está en movimiento; la mayoría de estos movimientos no tienen sentido, y no tiene sentido prestarles atención, solo a los picos realmente grandes e infrecuentes.
Otra consecuencia de los grandes datos es tener demasiados observables simultáneos, lo que hace que sea ridículamente fácil dibujar correlaciones espurias. En esto, vea las maravillosas 15 cosas locas que se correlacionan entre sí.

Para colmo, citando el artículo de Wired, “Big data puede decirnos qué está mal, no qué está bien”.

Big DataBig Data AnalysisDataData AnalysisData MiningData Science

Related Content

¿Cuál es el salario de un desarrollador de Big Data Hadoop?

¿Qué es el análisis de datos grandes y el alcance de Hadoop?

¿Cómo deben usarse los grandes datos?

¿Dónde aprendo análisis de datos para un mejor trabajo?

Cómo preparar la interpretación y el análisis de datos financieros para una prueba bancaria (PYME)

¿Cómo determina Facebook dónde enviar paquetes si estoy conectado a la misma cuenta desde un sistema diferente en la misma red?

¿Por qué los televisores inteligentes Samsung no son lo suficientemente inteligentes como para cambiar al receptor cuando el receptor está encendido (tengo que silenciar el altavoz del televisor)?

Te daré 2 ejemplos de muchos otros sobre lo que Big Data puede hacer por la humanidad “YES Humanity”:

Algoritmo predice los ataques al corazón 4 horas antes de los médicos – Big Data Made Simple – Una fuente. Muchas perspectivas

Entonces, los médicos tienen muchas posibilidades de reaccionar antes de que ocurra el ataque cardíaco
2. Grandes datos para predecir accidentes en tierra, tsunamis y otros desastres naturales – Predictive Analytics Today

Espero que eso te ayude.

Rafael Kaufmann Nedal

Honestamente, no creo que sea una gran mierda. El análisis de datos ha existido durante siglos y se mantendrá. Con el avance de la tecnología de computación, solo encontraremos formas más novedosas de analizar datos y estudiar problemas con un ángulo diferente. Pero sí estoy de acuerdo en que hay cierto factor de exageración en la convergencia de los medios actuales que convierte cualquier cosa con etiqueta de “big data” en algo mágico y, para mí, es exagerado.

Rafael Kaufmann Nedal

More Interesting

¿Cuáles son las opciones de salida de Mu Sigma?

¿Dónde debo unirme para la capacitación en ciencia de datos?

¿Todas las técnicas de compresión de datos sin pérdida requieren algún tipo de archivo / metadatos de mapeo que ilustre cómo recuperar datos originales?

¿Cómo se relacionan entre sí los campos de Minería de datos, Aprendizaje automático y Big Data?

¿Qué campo debo elegir ciencia de datos o desarrollo web completo?

¿Qué pasos se deben tomar para tener una comprensión rigurosa de la ciencia de datos (lado teórico, especialmente)?

¿Cuál sería un buen problema de recomendación de Kaggle para elegir como un proyecto corto?

¿Qué tan difícil es para un chico experimentado de 5 años cambiar a la carrera de ciencia de datos en India?

¿Qué son los datos en bruto en las estadísticas?

Quería ser un científico de datos, pero desde que me uní a la industria justo después de los estudiantes universitarios, no obtengo ese tipo de roles. Ir a un MS es muy difícil ahora que ya he pasado algunos años en la industria del software. ¿Qué tengo que hacer?

¿Qué ha contribuido en gran medida al lanzamiento de la era de Big Data?

¿Cómo usan las grandes organizaciones los grandes datos?

¿Qué queremos decir cuando usamos la palabra ruido en ciencia de datos y estadística?

¿Qué instituto es mejor para un curso de ciencia de datos en Pune?

¿Cómo deberían funcionar mejor la ciencia y la ingeniería de datos?

Web Analytics