¿La correlación entre dos variables cuenta como evidencia débil de un vínculo causal entre ellas?

Esta es una pregunta fascinante.

Por un lado, me gustaría señalar un principio filosófico llamado principio de causa común de Reichenbach [1] que establece lo siguiente: “la correlación entre los eventos A y B indica que A causa B , o que B causa A , o que A y B tienen una (s) causa (s) común (s) “.

Si miras ejemplos cotidianos, es probable que tengas dificultades para encontrar contraejemplos de sonido, al menos yo lo hago.

Por otro lado, si tú

tomar un montón de variables totalmente independientes
sacar una muestra finita
mira la correlación empírica entre cada par de variables
elige el par más correlacionado

tendrá altas posibilidades de terminar con dos variables independientes (según el modelo) que están altamente correlacionadas (según los datos). Estas posibilidades aumentarán con el número de variables independientes y disminuirán con el tamaño de la muestra.

Entonces, si observa datos lo suficientemente pequeños de un rango de variables lo suficientemente amplio, puede encontrar este tipo de correlación espuria entre variables independientes (por ejemplo, el nivel de agua en Venecia y el precio del pan como en [1]).

[1] Principio de causa común de Reichenbach

Aprendizaje automáticoEstadísticaInferencia bayesianaRedes bayesianas

¿Cómo se hacen los algoritmos EM?

¿Cuándo usan los combatientes la ametralladora / cañón y cuándo usan misiles en el combate aire-aire?

¿Qué métricas debo usar en mi investigación de preprocesamiento de datos (no estructurada)?

¿Con qué facilidad pueden los actuarios cambiar a carreras relacionadas con TI como la ciencia de datos, el aprendizaje automático y el desarrollo de software?

Cómo comenzar a hacer un proyecto de aprendizaje automático

¿Cuáles son los mejores algoritmos para el conjunto de datos de preservación de la privacidad?

Según tengo entendido, quiere decir “si dos variables están correlacionadas, entonces no es necesario que una de ellas cause la otra”.

Al principio, debe entenderse que la correlación (+ ve Or -ve) no es causalidad y viceversa. En palabras simples, no se puede inferir con dos variables correlacionadas si una causa otra. No podemos decir si hay algún vínculo causal (débil o fuerte) entre los dos.

Aquí, sería pertinente citar el ejemplo muy básico de correlación que muchos lectores ya podrían saber, es decir, “El tamaño del zapato y el coeficiente intelectual de los niños”. Ambas variables están (en la mayoría de los ejemplos de conjuntos de datos) están altamente positivamente correlacionadas pero tampoco causa otro.

Hay una excepción divertida aunque …

El número de matrimonios y el número de divorcios están altamente correlacionados y definitivamente uno es causado por el otro. El divorcio seguramente es causado por el matrimonio.

¡Espero que esto ayude!

Simon Appleton

No. No, no y no. La correlación no es causalidad (si comiera una galleta cada vez que use esta oración, ahora sería obeso mórbido).

Sin embargo, podría valer la pena verificar la relación causal si existe una fuerte correlación.

Un policía que encuentra un cadáver no es suficiente evidencia para concluir que fue un asesino. Sin embargo, si hay un asesinato, generalmente la policía encuentra un cadáver, pero no necesariamente.

Entonces, la correlación a veces lleva a los analistas a descubrir vínculos causales. Pero no es una evidencia definitiva de lo mismo.

Simon Appleton

Yo diría que la respuesta depende de qué, exactamente, quieres decir con evidencia débil.

Más o menos, si A causa B, entonces A y B se “correlacionarán” (aunque no necesariamente mostrarán una correlación lineal). Entonces, si ve que A y B se correlacionan, es un poco más plausible que A cause B de lo que era antes de ver esa correlación. Sin embargo, también es un poco más plausible de lo que era antes que B cause A. Y sigue siendo bastante probable que ninguno de los dos cause al otro.

Entonces, si ese párrafo significa “evidencia débil” para usted, entonces seguro. Pero si eso es lo que significa para usted, asegúrese de saber exactamente cómo está usando ese término. La mayoría de las estadísticas no lo usarían de esa manera (como se ve en las otras respuestas).

Sabarinath Warrier

La respuesta corta es no, como Tyler viglen demuestra muy bien aquí: 15 cosas locas que se correlacionan entre sí

Sin embargo, si se encuentra una correlación y un vínculo causal parece plausible, entonces esa información se puede utilizar para dirigir más investigaciones para tratar de encontrar un vínculo causal (por ejemplo, un estudio de cohorte o un ensayo controlado aleatorio en epidemiología)

Simon Appleton

Incluso una fuerte correlación entre dos variables no significaría ningún tipo de causalidad.

Puedes encontrar divertidos ejemplos de esto en google.

http://www.tylervigen.com/spurio …

Simon Appleton

More Interesting

Investigadores de aprendizaje automático, ¿algún día los robots nos matarán a todos?

¿Cómo puedo comenzar a construir un motor de recomendación? ¿Dónde puedo encontrar un conjunto de datos interesante? ¿Con qué herramientas / tecnologías / algoritmos es mejor construir el motor? ¿Cómo verifico la efectividad de las recomendaciones?

¿El sobreajuste es un problema en el aprendizaje de refuerzo profundo?

En TensorFlow, ¿qué es una capa 'densa' y una 'abandonada'?

¿Cuáles son algunas aplicaciones potenciales del seguimiento de objetos depredadores (nuevo algoritmo)?

¿Cuál es la ventaja de tener en cuenta la curvatura al optimizar las redes neuronales profundas?