Sorprendentemente, ya lo hemos estado haciendo durante el último medio siglo.
Se llama estadísticas. Los programas introductorios tratan casi exclusivamente con la prueba de hipótesis, con mucho, la rama de estadísticas más importante y útil (pregúntele a cualquier físico, médico, economista, científico social o más: vive y muere por el rigor de sus análisis estadísticos en esos campos). Fueron las estadísticas y las pruebas estadísticas rigurosas las que hicieron ilegal la publicidad del tabaco (y las afirmaciones falsas que los fabricantes de tabaco recomiendan habitualmente) en los Estados Unidos (razón por la cual ya no se ven más anuncios de cigarrillos Camel). Fumar movimiento, o mejor aún, lea El emperador de todas las enfermedades . Hoy en día, los estadísticos continúan empujando el sobre para mejorar y rectificar los estándares del experimento, y para producir gráficos de calidad consistente (gráficos de caja, gráficos de varianza, gráficos de rosa, todo el shebang) que documentan los resultados de manera sucinta. Algunas personas recuerdan las infames ‘mentiras, malditas mentiras y estadísticas’ de Disraeli cuando escuchan ‘estadístico’; Sin embargo, esas personas nunca han asistido a una conferencia real sobre estadísticas y, por lo tanto, no son conscientes del hecho de que son los humanos, no las estadísticas, los que distorsionan los hechos y tergiversan la realidad. Las estadísticas, nuestro conocimiento de cómo examinar la evidencia, es un campo matemático riguroso que ha estado en el negocio de probar reclamos durante varias décadas.
No necesita la ciencia de datos (que, por cierto, son solo estadísticas combinadas con una gran potencia informática, y casi nada de lo que parece estar pensando) para hacer algo que ya ha existido mucho antes incluso de que se convirtiera en una frase. Si desea ver a la gente demostrar que las afirmaciones falsas son erróneas más allá de cualquier duda, tome un diario estadístico. Si desea visualizaciones de tales hechos, tome un diario estadístico . La ciencia de datos no va a hacer nada de esto, porque eso no es lo que es la ciencia de datos: las estadísticas lo harán, como lo ha sido durante los últimos cincuenta años, porque eso es lo que motiva a muchos estadísticos modernos y ese es el propósito hacia el cual las personas están impulsado hacia en las estadísticas.
- ¿Entrar en Big Data es una buena opción ahora?
- ¿Cómo se puede utilizar el análisis de datos en las escuelas?
- ¿Qué sigue después de la regresión múltiple para la ciencia de datos?
- ¿Cómo es un día para un científico de bioinformática?
- ¿Qué tipo de predicción puede ser posible usando la ciencia de datos en LinkedIn?
La única razón por la cual las personas nunca piensan en las estadísticas de esta manera es porque la mayoría de las personas nunca se han presentado a ellas: piensan ‘media, moda, mediana’, cuando el núcleo de las estadísticas siempre ha sido la prueba de hipótesis. En realidad, me entristece que tenga que tomar algo tan publicitado como la ‘ciencia de datos’ para llamar la atención sobre algo que debería ser conocimiento del hogar.
Entonces, para responder a su pregunta, hemos estado en esa era durante cincuenta años . Lo digo en serio. Hemos investigado tanto sobre falacias lógicas, prejuicios y diseños de experimentos para probar afirmaciones en los últimos dos siglos que no encontrará ningún siglo más equipado para combatir la falsedad. Literalmente, puede “ver” la desacreditación que se está haciendo en cualquier número de artículos que hacen todo bien al diseñar estudios aleatorizados, doble ciego para probar dos tipos de tratamientos médicos para los cuales es mejor. Como solo un ejemplo de miles de personas, aquí hay un documento que evalúa las famosas hipótesis de ventanas rotas utilizando el experimento más grande jamás diseñado para tal propósito y lo encuentra con muchas ganas: Ventanas rotas: nueva evidencia de la ciudad de Nueva York y un Social de cinco ciudades Experimentar.
Pero no, nunca podremos ver tonterías físicamente, como lo expresaste con tanta delicadeza. La única forma de discernir si un reclamo es falso es probarlo utilizando el método científico y las estadísticas. Para hacer eso, necesita acceso a condiciones experimentales cuidadosamente controladas, algo que es imposible si está sentado de forma remota en una computadora mientras ingresan los datos.