Cómo saber si mi modelo de regresión es heteroscedastic u homoscedastic de mi modelo de residuos

Desde el gráfico residual que ha mostrado, su modelo no se ve muy bien.

En cada punto a lo largo del eje ‘ajustado’, sus residuos deben distribuirse uniformemente por encima y por debajo de la línea, con una distribución simétrica que no se ensancha ni se estrecha a medida que avanza.

Parece que sus datos son extremadamente asimétricos, por lo que quizás debería considerar una transformación o un modelo de respuesta diferente antes de comenzar el análisis de regresión. Parece que está usando R, considere el paquete GAMLSS para ajustar los datos con distribuciones arbitrarias no normales.

Alternativamente, podría (i) estratificar su análisis en función de la variable de dos niveles que es responsable de la división principal en los valores ajustados o (ii) incluir términos de interacción entre esa variable y los predictores restantes. Puede ser que vea cambios sustanciales en el tamaño y la dirección de los coeficientes.

Un análisis descriptivo de sus datos probablemente le ayudaría mucho a decidir qué tipo de modelo debe ajustar.

La heterocedasticidad no es tu problema. Siempre es bueno dejar que sus datos le hablen en lugar de buscar problemas preconcebidos.

Su variable dependiente claramente varía de cero a uno, y su variable independiente tiene dos grupos. Cuando predice un valor por debajo de 0.4, con frecuencia obtiene un cero, la mayoría del resto del tiempo se sobreevalúa un poco y el resto del tiempo se subestima mucho. Cuando predice un valor superior a 0.6, con frecuencia obtiene uno, y generalmente se sobredice por un poco, pero ocasionalmente se subestima mucho. Parece que solo tiene una modesta previsibilidad dentro del clúster.

Sus estimaciones de regresión básicamente le indican la diferencia promedio entre los grupos. Mi sugerencia es calcular esto directamente, restarlo de los datos y trabajar en ajustar el residuo.

También investigaría si 0 y 1 son valores especiales, como parecen ser.

Hola,

Algunas formas comunes de hacer esto es aplicando el test de Breusch-Pagan, White o White’s simplefied. Los 3 están bien descritos en libros (Woolrigde ha escrito un hermoso libro) y también puede buscar en Internet las especificaciones completas.

Básicamente, todos buscan un patrón en sus residuos. Si encuentra un patrón (en algún nivel de significación), puede rechazar la hipótesis de que son homoscedastic.

Toma tus residuos para la regresión con la que estás trabajando, cuadrátalos. Luego use estos residuos al cuadrado como la variable dependiente en una regresión auxiliar (ayudando a la regresión, aquí ayuda a determinar si hay heterocedasticidad en su regresión de interés), mientras usa todas las variables independientes de su regresión original.
Si las variables independientes (recuerde ignorar la constante) son simultáneamente significativamente diferentes de cero (lo que significa que puede rechazar todas son iguales a cero al mismo tiempo), entonces puede rechazar la homocedasticidad. De lo contrario, podría sugerir que tiene heterogeneidad en su modelo original.

Espero eso ayude