¿Llegarán los big data y la visualización de datos a una era de exponer BS pseudo-filosóficas y pseudocientíficas (como la radiografía expone la patología subyacente) visualizando antipatrones en razonamiento, calidad de evidencia y silenciamiento de críticos? ¿’Veremos’ BS?

Sorprendentemente, ya lo hemos estado haciendo durante el último medio siglo.


Se llama estadísticas. Los programas introductorios tratan casi exclusivamente con la prueba de hipótesis, con mucho, la rama de estadísticas más importante y útil (pregúntele a cualquier físico, médico, economista, científico social o más: vive y muere por el rigor de sus análisis estadísticos en esos campos). Fueron las estadísticas y las pruebas estadísticas rigurosas las que hicieron ilegal la publicidad del tabaco (y las afirmaciones falsas que los fabricantes de tabaco recomiendan habitualmente) en los Estados Unidos (razón por la cual ya no se ven más anuncios de cigarrillos Camel). Fumar movimiento, o mejor aún, lea El emperador de todas las enfermedades . Hoy en día, los estadísticos continúan empujando el sobre para mejorar y rectificar los estándares del experimento, y para producir gráficos de calidad consistente (gráficos de caja, gráficos de varianza, gráficos de rosa, todo el shebang) que documentan los resultados de manera sucinta. Algunas personas recuerdan las infames ‘mentiras, malditas mentiras y estadísticas’ de Disraeli cuando escuchan ‘estadístico’; Sin embargo, esas personas nunca han asistido a una conferencia real sobre estadísticas y, por lo tanto, no son conscientes del hecho de que son los humanos, no las estadísticas, los que distorsionan los hechos y tergiversan la realidad. Las estadísticas, nuestro conocimiento de cómo examinar la evidencia, es un campo matemático riguroso que ha estado en el negocio de probar reclamos durante varias décadas.

No necesita la ciencia de datos (que, por cierto, son solo estadísticas combinadas con una gran potencia informática, y casi nada de lo que parece estar pensando) para hacer algo que ya ha existido mucho antes incluso de que se convirtiera en una frase. Si desea ver a la gente demostrar que las afirmaciones falsas son erróneas más allá de cualquier duda, tome un diario estadístico. Si desea visualizaciones de tales hechos, tome un diario estadístico . La ciencia de datos no va a hacer nada de esto, porque eso no es lo que es la ciencia de datos: las estadísticas lo harán, como lo ha sido durante los últimos cincuenta años, porque eso es lo que motiva a muchos estadísticos modernos y ese es el propósito hacia el cual las personas están impulsado hacia en las estadísticas.

La única razón por la cual las personas nunca piensan en las estadísticas de esta manera es porque la mayoría de las personas nunca se han presentado a ellas: piensan ‘media, moda, mediana’, cuando el núcleo de las estadísticas siempre ha sido la prueba de hipótesis. En realidad, me entristece que tenga que tomar algo tan publicitado como la ‘ciencia de datos’ para llamar la atención sobre algo que debería ser conocimiento del hogar.


Entonces, para responder a su pregunta, hemos estado en esa era durante cincuenta años . Lo digo en serio. Hemos investigado tanto sobre falacias lógicas, prejuicios y diseños de experimentos para probar afirmaciones en los últimos dos siglos que no encontrará ningún siglo más equipado para combatir la falsedad. Literalmente, puede “ver” la desacreditación que se está haciendo en cualquier número de artículos que hacen todo bien al diseñar estudios aleatorizados, doble ciego para probar dos tipos de tratamientos médicos para los cuales es mejor. Como solo un ejemplo de miles de personas, aquí hay un documento que evalúa las famosas hipótesis de ventanas rotas utilizando el experimento más grande jamás diseñado para tal propósito y lo encuentra con muchas ganas: Ventanas rotas: nueva evidencia de la ciudad de Nueva York y un Social de cinco ciudades Experimentar.

Pero no, nunca podremos ver tonterías físicamente, como lo expresaste con tanta delicadeza. La única forma de discernir si un reclamo es falso es probarlo utilizando el método científico y las estadísticas. Para hacer eso, necesita acceso a condiciones experimentales cuidadosamente controladas, algo que es imposible si está sentado de forma remota en una computadora mientras ingresan los datos.

Big Data no es un salvador, ni la visualización o las estadísticas o la ciencia o las estadísticas o cualquier medio subjetivo que las personas superen. Siempre tendrás a alguien que decida qué piensa BS y dónde apuntará su gran arma BS Ray.

More Interesting

¿Es la velocidad de la luz una restricción para los grandes datos?

Si necesito aprender ciencia de datos, ¿qué puedo aprender en el primer paso o de la A a la Z?

¿Cuál es la satisfacción laboral de los científicos de datos? ¿Para qué tipo de empresas ha trabajado o trabaja para ahora de alguna manera, y ahora es un científico de datos? ¿Qué responsabilidades e impacto ha influido en la empresa?

¿Cuáles son los requisitos previos para aprender Hadoop y la ciencia de datos?

¿Qué habilidades de análisis de datos requieren las grandes consultoras?

Cómo aprender Python con respecto al desarrollo de Big Data

¿En cuál debo inscribirme, Udacity data science nanodegree o diploma actualizado de PG en análisis de datos?

¿Cómo puede un aspirante a científico de datos con experiencia en estadísticas aprender más sobre bases de datos, ETL, almacenamiento de datos?

¿Hay alguna reunión de ciencia de datos en Chennai, India?

Para aprender IA, ¿debería saber ciencia de datos?

¿Cómo es la ciencia de datos fintech única? ¿Es único?

¿Cuáles son las bases de datos disponibles en Salud (datos abiertos) que se pueden usar en el análisis de datos con algoritmos de aprendizaje automático?

¿Es posible aprender el aprendizaje automático y la ciencia de datos a través de MOOCS y otras fuentes en línea o debería estudiar una maestría en CS?

¿Es valioso un Máster en Ciencia de Datos después de un MBA para una carrera en análisis de negocios?

¿Cuál es el mejor programa de ciencia de datos?