¿Es inevitable la multicolinealidad en los datos experimentales? Si no, ¿en qué condiciones podemos esperar multicolinealidad?

Sí, hasta cierto punto. TODAS las variables del mundo real están ‘correlacionadas’, pero todo esto significa que la correlación calculada no es exactamente cero.

En las clases de estadística, los estudiantes siempre preguntan “¿cuán correlacionado es demasiado?”, Generalmente en un contexto de regresión. Pero no hay una respuesta dura y rápida a esto. Si está haciendo una regresión con muchas variables “X”, y ninguna de ellas está más correlacionada que, digamos, .2, probablemente no tenga nada de qué preocuparse. Si muchos de ellos están correlacionados por encima de .8, tienes un problema real en tus manos.

En cuanto a cuándo puede esperar multicolinealidad, tampoco existe una regla estricta, pero una vez que puede hacerlo es cuando está tomando múltiples medidas de la misma construcción subyacente. Por ejemplo, si quiero ver si las familias más pobres tienen algún resultado (por ejemplo, nivel de educación) más o menos que otras familias, recopilaría múltiples medidas de su situación económica, incluidos los salarios de todos los adultos en el hogar, ahorros, etc. Y todas esas medidas estarían altamente correlacionadas (las personas con salarios altos tienden a tener más ahorros).

Pero algunas cosas obviamente no relacionadas también pueden tener fuertes correlaciones, como muestra esta página bastante entretenida: 15 cosas insanas que se correlacionan entre sí.