¿Por qué no reescalamos el vector de coeficiente de una regresión de lazo?

Los coeficientes de lazo están sesgados debido a un umbral suave. Tiene dos opciones para reducir el sesgo en estos coeficientes.

Una es reajustar los mínimos cuadrados ordinarios usando una estimación de regresión de lazo inicial. Realice OLS utilizando una matriz de datos reducida reteniendo columnas que correspondan a coeficientes de regresión de lazo diferente de cero. Debe interpretar el lazo reacondicionado con precaución, ya que el lazo tiende a seleccionar muchas variables de ruido en el modelo y, en consecuencia, los valores reajustados aún podrían estar sesgados. La interpretación de los coeficientes OLS reajustados depende de las variables / columnas en el modelo.

Alternativamente, puede usar el lazo adaptable que intenta penalizar adaptativamente cada coeficiente de regresión. Los coeficientes grandes reciben una penalización pequeña y los coeficientes pequeños reciben una penalización mayor. Dado que los coeficientes son desconocidos de antemano, primero debe utilizar la regresión de cresta o lazo para obtener una estimación inicial de [matemática] \ beta [/ matemática] y luego utilizar una penalización de lazo ponderada para obtener estimaciones menos sesgadas.

Lo que intenta hacer a través de la reescalado es incorrecto ya que las variables en el modelo que usa un mínimo cuadrado inicial son diferentes del lazo. Además, todavía tiene una [matemática] X [/ matemática] mal acondicionada en altas dimensiones.

Referencias
Adaptive Lasso review paper http://www3.stat.sinica.edu.tw/s…

Related Content

¿Por qué la longitud desigual del texto es un problema en el procesamiento del lenguaje natural?

¿Es necesario un conjunto de validación si no se realiza un ajuste de hiperparámetro?

Cómo implementar el reconocimiento de imágenes para crear una aplicación para organizar imágenes

¿Cómo afectarán herramientas como BigML y Google Prediction API al aprendizaje automático? ¿Reducirá la demanda de científicos de datos?

¿Hay alguna forma de llamar a las funciones de Python desde mi aplicación NodeJS para aprovechar el poder del aprendizaje automático en una aplicación Node?

¿Dónde está el mejor lugar para aprender el pronóstico de series de tiempo?

¿Dónde puedo encontrar un conjunto de datos satelitales espaciales?

Gracias por el A2A.

No voy a entrar en las matemáticas aquí (soy más un analista de datos que un estadístico teórico), pero el objetivo de LASSO es reducir el sesgo de las estimaciones de OLS mediante penalización.

Si comienza con una sola hipótesis a priori y prueba solo esa hipótesis, las estimaciones de OLS son AZUL (las mejores estimaciones lineales insesgadas). En este caso, LASSO está contraindicado.

Sin embargo, con bastante frecuencia, deseamos hacer más que eso. Tenemos una situación en la que tenemos muchas variables independientes potenciales y deseamos descubrir cuáles incluir en la regresión. Desde mi punto de vista (y el de muchas otras personas), la mejor manera de hacerlo es utilizar el conocimiento sustantivo. Sin embargo, a veces el conocimiento subnatural no está allí; otras veces el experto sustantivo se niega a decirle al analista de datos. (Sí, esto pasa).

Entonces, una cosa incorrecta que hacer es cualquier forma de selección de variables paso a paso, hacia adelante o hacia atrás. Otro es el cribado bivariado. Todo esto dará resultados incorrectos: los errores estándar son demasiado pequeños, los valores de p son demasiado pequeños, los parámetros se desvían de 0.

LASSO es un intento de corregir esto. Al volver a escalarlo, está reintroduciendo sesgo, no eliminándolo. (Al menos, si el LASSO funcionó correctamente).

Peter Flom

More Interesting

¿Qué es mejor para el aprendizaje profundo: TensorFlow o Chainer?

¿Qué área de la PNL es más prometedora y gana más tracción en la industria: la PNL sobre los datos de voz frente a texto?

¿Qué es un gran blog para el aprendizaje automático?

¿Será factible dentro de los próximos 5 años que una API de aprendizaje automático maneje la construcción de representaciones significativas a partir de datos sin procesar?

En la extracción de relaciones (PNL), ¿cuál es la diferencia entre la extracción de relaciones supervisada, semi-supervisada y no supervisada?

¿Cómo aprendo el aprendizaje automático y dónde puedo practicarlo?

¿Qué tan difícil es pasar de la optimización aplicada al aprendizaje automático / ciencia de datos?

¿Vale la pena un doctorado en CS si no planea ingresar a la academia?

¿Cuál es la mejor y más fácil forma de aprender el aprendizaje automático?

¿Cuáles son las mejores prácticas para garantizar que los datos adquiridos de la investigación que implica el análisis de Big Data resulten precisos y útiles?

¿El aprendizaje no supervisado es la clave de la inteligencia artificial general?

¿Por qué Microsoft decidió usar bosques aleatorios en el Kinect?

¿Cuál es la derivación matemática de la regresión logística?

¿Cuál es el alcance del aprendizaje automático en la verificación?

¿Cómo se infiere la distribución posterior marginal?

Web Analytics