Realmente no puede. Junto con las excelentes respuestas técnicas ya enumeradas, me gustaría que hicieras un experimento mental conmigo.
Digamos que tienes un buen auto. Tiene un excelente trabajo de pintura, está en excelente forma y le gusta mantenerlo limpio y detallado. Tienes que lavarlo más de lo que quieres, porque parece que cada vez que limpias el auto, llueve o te ensucias de una manera u otra. Después de un año más o menos, comienzas a bromear diciendo que parece que la mejor manera de saber si lloverá es limpiar tu auto; la lluvia seguirá.
Debido a que eres del tipo curioso, decides hacer un análisis muy simple de los dos, obviamente, lavar tu auto es la variable independiente, ya que es algo que puedes manipular, y la lluvia es la variable dependiente.
Descubres, por Dios, que hay un 89% de posibilidades de que llueva dentro de un día después de lavar tu auto, y que el efecto es incluso estadísticamente significativo. Eres, literalmente, un semidiós del clima (o tal vez has molestado a uno).
Aquí es donde la gente se burla y dice “bueno, sabemos qué causa la lluvia y obviamente no es si alguien lava o no su auto”, bueno, y tienen razón. Lavar su automóvil no está relacionado con el clima.
¿Cómo sabemos que lavar tu auto causa lluvia? Después de todo, cumple con los requisitos para ser estadísticamente significativo Y está altamente correlacionado con la prueba de su elección.
¿Pero por qué?
¿Por qué la prueba no es lo suficientemente buena por sí sola?
No es lo suficientemente bueno en sí mismo porque probar si algo es causal o no depende de cosas fuera de la prueba. En este caso, también es una prueba mal diseñada, pero la analogía se mantiene.
Por todas las razones técnicas enumeradas en otras respuestas, todo lo que tenemos en el mejor de los casos son algunos patrones de variación realmente sugestivos. Las decisiones sobre la causalidad se toman fuera de la prueba, y cuando llegas a cierto punto en el estudio de las cosas, te das cuenta de que hay mucho más “creemos que es así” que “estamos bastante seguros”. En realidad, hay muy poco “sabemos que esto sea cierto” en el estudio de las ciencias, y lo que hay está vinculado a un contexto específico y algunos requisitos muy específicos.
La probabilidad depende en gran medida del contexto, y también lo son nuestras medidas. Yo, usted y cualquier otra persona que estudie la probabilidad podemos hacer experimentos de cualquier manera que nos plazca y jugar con los componentes hasta que obtengamos la respuesta que nos gusta. Siempre me ha gustado este gráfico como una demostración de eso:
(Gracias, Tyler Vigen. Enlace de imagen: Correlaciones espurias)
¡Mira cuán estrechamente relacionadas están esas dos distribuciones!
¿Cuál es el contexto presuntivo, aquí? ¿Cuál es la narrativa entre el consumo per cápita de queso y la muerte por el enredo de la sábana? (La respuesta es humor, pero estoy tratando deliberadamente de hacer que las estadísticas de pensamiento midan la correlación extraña, * porque es, a medida que aprende sobre las estadísticas, una suposición ** comprensible y, sin embargo, extraña.)
La narrativa es la razón no técnica por la que no se puede usar la probabilidad para encontrar la causalidad, y deliberadamente estoy lanzando esto en inglés sencillo (las razones técnicas se han cubierto admirablemente, solo estoy limpiando). En un experimento, estás creando un pequeño mundo artificial que tiene, en el mejor de los casos, una relación tangencial con el bombardeo de la casualidad en los acontecimientos cotidianos. Pasas meses cuidadosamente averiguando cómo compensar, aislar, manipular y / o negociar circunstancias para poder descartar tantas cosas como sea posible y acercarte lo más posible a lo que quieres medir.
El proceso de medición es efectuado por usted, sus elecciones, los materiales involucrados, una serie de condiciones globales (por lo que quiero decir que abarca o afecta a todas) verdaderas del evento y la población en particular, y cosas tan dispares como el error humano regular o algo que usted no tiene. No pensé en absoluto.
También se ve afectado por el tiempo, patrones de variación no buscados que pueden afectar lo que está tratando de medir y / o cualquier cosa que no pueda evitar. La solución clásica es asegurarse de que sea tan aleatorio que cualquier cosa ordenada se destaque.
Volvamos al queso y las sábanas. Ambos provienen de datos estadounidenses, ambos cubren los años 2000-2009, ambos provienen de agencias de informes reconocidas a nivel nacional (USDA y CDC), y ambos se refieren al comportamiento humano. ***
¿Cuáles son algunas razones generales por las cuales podríamos descartar que el queso cause la muerte por las sábanas o, dado que esto es solo frecuencia, la muerte por las sábanas que causa el consumo de queso?
Como ejercicio, aquí hay algunas razones por las que podríamos descartar que una de estas causas sea la otra:
- la gente no suele comer queso en la cama, colocando cierta distancia física entre el queso y las sábanas (no podemos colocar el queso en la escena del crimen).
- las personas no pueden comer queso mientras mueren de sábanas (sus bocas están ocupadas)
- la gente parece poder comer queso regularmente sin asfixiarse (o Wisconsin estaría en problemas).
- Es probable que las personas intolerantes a la lactosa, que presumiblemente no comen queso, no se asfixien en sus sábanas. No sabemos si sufren la misma tasa de muerte por sábanas.
- la asfixia en las sábanas es mucho menos probable que el consumo de queso, comparando los datos per cápita con el número bruto de personas que se asfixiaron en sus sábanas (no podemos, por supuesto, descartar que el queso se escabulle allí en medio de la noche y descartarlos) como venganza por ser masticado) ****
Aquí hay algunas razones por las que podríamos elegir creer que hubo una relación:
- mayor obesidad causada por el alto consumo de queso per cápita
- problemas cardiovasculares aumentados causados por el alto consumo de queso per cápita
- una erupción de estrés comiendo y evitando el gimnasio
- una erupción de queso al comer y sobredosis de medicamentos para dormir
- sábanas y queso maliciosos que solo quieren estar cerca de ti ******
Para medir incluso, debes comenzar a tomar decisiones sobre lo que parece probable para que sepas qué medir. También deberá comenzar a introducir otras cosas, como la obesidad (que, para su información, no está en estos datos) o el queso sensible.
Si desea hacerlo de manera responsable, utilizará las categorías enumeradas en las respuestas más técnicas: querrá los criterios de Hill, que figuran en otra respuesta.
Sin embargo, notará que, según los criterios de Hill, hay varias categorías que requieren que haga llamadas de juicio.
Para el experimento de pensamiento original, que involucra lavar su automóvil y la lluvia, tenemos precedencia temporal, fuerza, una leve cantidad de coherencia, y eso es todo.
Para el queso y las sábanas, tenemos resistencia, consistencia y posiblemente un gradiente biológico tal que el aumento del consumo de queso se combina con una mayor muerte por sábana.
El llamado al juicio llega cuando comenzamos a hablar de plausibilidad. Afortunadamente, es probable que ambos ejemplos se consideren inverosímiles, y podemos descartarlos (pero el queso aún puede ser culpable).
De una manera completamente no técnica, esa es una de las razones fundamentales por las que las estadísticas no son útiles para la causalidad en el sentido estricto (matemático), solo sugestivas en un sentido práctico. Tiene que ser juzgado, finalmente, por usted, por su plausibilidad.
También ayuda a comparar la causalidad lógica formal con esto, y prometo que me detendré con el queso (no hago tales promesas sobre las sábanas).
Las estadísticas son como el primo más salvaje de las matemáticas y la lógica, donde la respuesta es casi siempre “tal vez”. En lógica y partes de las matemáticas, hay afirmaciones que pueden decirse que son causales de una manera formal y rigurosa. Hay dos condiciones en esas relaciones causales que determinan la naturaleza de su relación: necesidad y suficiencia.
Decir que algo es necesario es decir que todo lo que está sucediendo no sucede sin que lo primero exista y / o sea cierto. Decir que es suficiente es decir que lo que está sucediendo tiene un valor de verdad que depende de lo primero.
El ejemplo clásico de la lógica es el silogismo: si A, entonces B.
Debería leer esto: si A existe y es verdadero, B existe y es verdadero.
En el caso de la lluvia y el automóvil, ¿podemos decir que si el automóvil se lava, entonces lloverá?
Obviamente no. Lo mismo para el queso.
Podríamos decir, según el gráfico, que el queso puede ser suficiente para la muerte por las sábanas (pero debe estar preparado para que se rían de él). No podemos decir, bajo ninguna circunstancia, que si se consume queso, se produce la muerte por las sábanas.
Puede ser suficiente, pero definitivamente no es necesario. Puede tener uno sin el otro, Y la frecuencia sugiere que puede tener una gran cantidad de queso sin muerte por hoja.
Ese es, por cierto, un problema en el corazón de la causalidad que merece años de estudio realmente difícil.
Lo único que podemos decir es algo sobre la suficiencia. Casi nunca podemos decir nada sobre la necesidad.
Imagínese, si lo desea, tratando de garantizar que se satisfagan tanto la suficiencia como la necesidad en un experimento de laboratorio.
Cuando haya terminado con el dolor de cabeza (y le animo a que lo intente, porque es importante ensuciarse las manos con este problema), debe tomarse un momento y apreciar la belleza desordenada que se está aplicando a cualquier tema. rigor a la causalidad en un complejo campo de variación.
Tómese un día en algún momento y comience a tratar de rastrear las variables que convergen en su taza de café / té / cacao y su apariencia en su mano. Las estadísticas son un tema para las personas que se sienten cómodas, o al menos están dispuestas, a mirar infinitamente a los ojos.
Y no te preocupes, no diré que se vuelve más fácil (porque siempre es infinito y te está mirando directamente a ti), pero sí aprendes a navegar con más habilidad.
Si está a la altura, le recomiendo leer algunos de los clásicos de estadísticas (particularmente el Tratado de probabilidad de John Maynard Keyes y su búsqueda de LaPlace, y la teoría de probabilidad más moderna : la lógica de la ciencia por ET Jaynes).
Allí. Probablemente sea más de lo que siempre quisiste saber, pero espero que te haya sido útil.
___________________________
* La probabilidad es la respuesta a la pregunta “¿cómo puedo hacer que mi mundo sea completamente inestable”? La respuesta completa es “estudiando si algo sucede o no en lugar de asumir que sucede”.
La locura comienza poco después de que comiences a tener que probar métodos y para cuando escribas una disertación, eres una causa perdida.
Escapé a la ingeniería, que seguramente es más cuerdo.
Decir ah. Jaja. HAHAHAHAHA —- oh dios, estoy postergando estudiar la serie de Taylor y escribir árboles autoensamblables en C ………
……
… ..
…
..
* ayuda *
** A medida que estudias estadísticas, andas a tientas en un vasto mar de extrañeza, buscando puntos de referencia. Queremos que sea causal porque el mar es vasto, oscuro y lleno de tiburones que tienen la mala costumbre de hacer cosas como señalar que las moléculas en nuestro bote solo están convenientemente juntas.
*** Si se trata de humanos, haces lo mejor que puedes para aislar, pero no vas a obtener datos completamente consistentes. Los humanos son pequeños patrones desordenados con una estructura de organización suelta, aunque reconocible, para sus comportamientos.
**** Soy intolerante a la lactosa. Confía en mí, el queso es vengativo.
***** Si el queso solo quiere estar cerca de ti, ten mucho cuidado. Podría estar preparándose para sofocarlo en sus sábanas.