Esta es una pregunta fascinante.
Por un lado, me gustaría señalar un principio filosófico llamado principio de causa común de Reichenbach [1] que establece lo siguiente: “la correlación entre los eventos A y B indica que A causa B , o que B causa A , o que A y B tienen una (s) causa (s) común (s) “.
Si miras ejemplos cotidianos, es probable que tengas dificultades para encontrar contraejemplos de sonido, al menos yo lo hago.
- Estoy tratando de construir un proyecto de aprendizaje automático para predecir el precio del automóvil usado. ¿Dónde puedo obtener una base de datos para la reventa de los autos usados?
- ¿Por qué es difícil entrenar un modelo de aprendizaje automático de forma incremental, en tiempo real?
- ¿Por qué la regresión logística se considera robusta a los valores atípicos en comparación con un método de mínimos cuadrados?
- ¿Cuáles son las mejores universidades para estudiar visión artificial con un enfoque en aprendizaje profundo?
- ¿Por qué utilizamos núcleos en algunos modelos de aprendizaje automático?
Por otro lado, si tú
- tomar un montón de variables totalmente independientes
- sacar una muestra finita
- mira la correlación empírica entre cada par de variables
- elige el par más correlacionado
tendrá altas posibilidades de terminar con dos variables independientes (según el modelo) que están altamente correlacionadas (según los datos). Estas posibilidades aumentarán con el número de variables independientes y disminuirán con el tamaño de la muestra.
Entonces, si observa datos lo suficientemente pequeños de un rango de variables lo suficientemente amplio, puede encontrar este tipo de correlación espuria entre variables independientes (por ejemplo, el nivel de agua en Venecia y el precio del pan como en [1]).
[1] Principio de causa común de Reichenbach