¿Qué son los grados fantasmas de libertad?

Creo que esta cita del artículo vinculado da una idea bastante buena de lo que son:

Las pruebas preliminares con los valores [math] p [/ math] no son el único culpable de producir estos llamados grados de libertad fantasma. Por ejemplo, a muchos de nosotros se nos enseña a explorar la posibilidad de una relación no lineal entre un predictor utilizando un procedimiento de 2 pasos. En el primer paso, incluimos un término lineal y no lineal, por ejemplo, [matemática] x [/ matemática] y [matemática] x ^ 2 [/ matemática], en el modelo. Si el término no lineal no es significativo, lo eliminamos de la ecuación e informamos solo el resultado del término lineal. Grambsch y O’Brien (19), sin embargo, muestran que cuando probamos y luego eliminamos un término no lineal no significativo e informamos solo sobre el coeficiente lineal, la prueba lineal restante es demasiado liberal a menos que tengamos en cuenta el grado de libertad gastado en probar que término no lineal

Un modelo lineal que contiene dos covariables, una significativa y otra insignificante, tiene un menor grado de libertad que el modelo lineal que solo incluye el término significativo. Entonces, si se ajusta al primer modelo lineal, elimina la covariable insignificante y luego realiza una prueba de hipótesis en el segundo modelo, usará demasiados grados de libertad en todas sus estadísticas de prueba. Estás “olvidando” que has estimado el coeficiente asociado con la característica insignificante.

Básicamente parece ser un problema de inferencia después de la selección de características, lo cual es de algún interés actual.