Ejecuto un modelo de regresión de Cox con dos variables y luego agrego otra variable a este modelo. Cuando agrego la tercera variable, la dirección de los coeficientes cambia. ¿Cómo puedo interpretar esto?

Verifique las correlaciones de orden cero entre la variable C y las variables A y B, respectivamente. A menos que me equivoque, las dos correlaciones deberían ser considerablemente altas, posiblemente de casi 0,70 de magnitud. Esto significa que su variable C media fuertemente las relaciones entre la variable de criterio y las variables A y B. Debido a la gran variación compartida compartida con las variables A y B, la inclusión de la variable C redujo las correlaciones parciales entre la variable A y la variable de criterio, y la variable B y la variable de criterio, es por eso que sus coeficientes beta de repente se volvieron tan cercanos a cero.

La multicolinealidad no dice nada sobre el tamaño de las correlaciones constituyentes de orden cero entre los predictores. Solo se convierte en un problema cuando casi todas las correlaciones eran altas (es decir, 0,90 y superiores). Normalmente, no es un problema en la regresión. Le sugiero que busque valores atípicos multivariados utilizando la distancia de Mahalanobis o la distancia de Cook. Por favor haga un análisis descriptivo detallado.

¡El cambio en la dirección del coeficiente ciertamente implica que su tercera variable es un factor de confusión o un modificador de efecto!
También dijo que sus variables no son colineales, lo que nuevamente apunta hacia un efecto de confusión. La confusión no siempre será colineal.

Confusor: cuando la tercera variable enmascara el efecto real

modificador de efecto: cuando su estimación de efecto cambia a través de los estratos de la tercera variable

Existen técnicas que se encargan de estos factores de confusión y le brindan un buen modelo de regresión.

Aquí está mi ejemplo favorito que da una ilustración simple de por qué un coeficiente puede cambiar en la regresión.

Suponga que su variable dependiente es Y = X + SIN (X). Es una especie de línea de tendencia tambaleante al alza. Suponga que su variable independiente es A = X-SIN (X). Estas variables están altamente correlacionadas a pesar de que el “bamboleo” va en la dirección opuesta debido al efecto abrumador de la tendencia. Ahora, si agrega otra variable a este modelo B = X, entonces el signo en A cambiará a lo opuesto porque ahora A solo compensa el bamboleo, no la tendencia. Puedes jugar con ellos para recrear tu situación (usa SIN y COS para dos factores de oscilación).

En su caso, C parece consolidar los efectos de A y B. ¿Son significativos los nuevos coeficientes? Parecen ser bastante bajos. ¿Podría ser el caso que sean importantes porque tiene una muestra muy grande?

Incluso si las variables no son altamente colineales, pueden relacionarse de esta manera. Su variable C modera o media las dos relaciones con A y B. La moderación ocurre a menudo. Busque moderación y mediación y eso debería ayudar.

More Interesting

Dadas las ventajas de usar el ternario como base de las computadoras, y la experiencia de los soviéticos, ¿por qué no hay computadoras cuaternarias ternarias o imaginarias? Knuth aprobó el ternario y propuso el cuaternario como eficiente para la computación científica.

¿Hay una manera eficiente de comparar la similitud de una cadena con cada permutación de otra cadena (es decir, un grupo simétrico)?

¿Para qué sirve la función explotar ()?

¿Existe alguna arquitectura de computadora basada en el cálculo lambda (en lugar de la máquina de Turing)?

¿Cuál es el mejor recurso para aprender sobre las pruebas de corrección para algoritmos?

Teoría de los tipos: ¿la comprensión de la correspondencia de Curry-Howard lo convierte en un mejor programador?

¿Cómo podría razonar matemáticamente sobre la corrección y solidez de un programa en programación funcional?

Como programador autodidacta, ¿cómo puedo saber mi nivel?

¿Cuál es la mejor manera de aprender el aprendizaje automático aprovechando mi sólida formación matemática?

¿Se puede descifrar algún código?

Cómo convertir una combinación dada a un solo número

¿Cuáles son algunos temas imprescindibles en matemática discreta y probabilidad de programación competitiva?

Cómo calcular el número de subsecuencias distintas de una palabra dada de una longitud dada

No puedo encontrar el máximo / mínimo de este problema del multiplicador de Lagrange sin obtener un número complejo cerca del final. ¿Qué estoy haciendo mal?

¿De qué manera es mejor transferir valores variables en JavaScript?