A menudo hay dos tipos de preguntas en las que uno puede estar interesado cuando se realiza una regresión dimensional alta
- Selección de variables, es decir, ¿está la variable en el modelo?
- ¿Qué tan grande es el coeficiente de regresión asociado con la variable?
Los métodos de estimación penalizados (particularmente la penalización \ ell-1) reducen considerablemente los coeficientes de las variables verdaderas en el modelo, especialmente aquellas con valores de coeficientes grandes. Por lo tanto, para la segunda pregunta, a menudo es más útil realizar una proyección de mínimos cuadrados sobre las características seleccionadas por una estimación regularizada. Esto no sería necesario si su objetivo es 1.
Realizar la proyección de mínimos cuadrados es útil para obtener mejores predicciones ya que el modelo proyectado de mínimos cuadrados tiene coeficientes que no son tan reducidos.
- Cómo interpretar la salida de una red neuronal
- ¿Cuáles son las principales aplicaciones potenciales para un cordón neural? ¿Hay algún peligro relacionado con el uso de dicha tecnología?
- ¿Cuánto Python necesito saber para completar un nanogrado de aprendizaje automático de Udacity?
- ¿Quién es el mejor científico de aprendizaje automático del mundo?
- ¿En qué se diferencia el aprendizaje profundo de la propagación por error (error)?
La advertencia:
Debe tener en cuenta la posibilidad de que la estimación regularizada sea incorrecta. Si la estimación regularizada tiene falsos negativos (coeficientes cero para componentes verdaderamente distintos de cero) o falsos positivos (coeficientes distintos de cero para componentes verdaderamente cero), la proyección de mínimos cuadrados subsiguientes puede ser engañosa. Tratar con este “sesgo de proyección” engañoso es ahora un tema candente en las estadísticas de alta dimensión. Por lo tanto, es extremadamente difícil cuantificar la incertidumbre de una estimación proyectada de mínimos cuadrados.
En particular, no puede realizar pruebas t en estas estimaciones proyectadas de mínimos cuadrados, ya que la prueba t no tiene en cuenta los errores que se arrastran en la selección del modelo o los coeficientes penalizados.