¿Existe la idea de utilizar la regularización para evitar el sobreajuste en la econometría, como lo enseñan los economistas?

La regularización se usa a menudo para problemas de alta dimensión. La respuesta de Rice Blues es correcta cuando se aplica a problemas inversos, pero la aplicación es más general.

Es cierto que la regularización a menudo se usa para problemas no identificados (llamados mal planteados) y está relacionada con el sobreajuste, que es un problema cuando el criterio más importante es la predicción, como en la mayoría de las aplicaciones de aprendizaje automático. En esos casos, la regularización compensa el sesgo de las estimaciones con la varianza.

Sin embargo, en la mayoría de los casos, los economistas y economistas no están interesados ​​en la predicción (en el sentido de LD) sino en estimaciones imparciales. La regresión de cresta produce estimaciones sesgadas, al igual que la red elástica . Hasta donde yo sé, la forma más común de regularización en economía es el LASSO, que se utiliza en la selección de parámetros / modelos. En lugar de reducirse, el LASSO impone un umbral difícil para pequeñas estimaciones y las pone a cero. Por lo tanto, puede usar el LASSO como primer paso en un espacio covariable de alta dimensión y luego usar las covariables restantes con coeficientes distintos de cero en una estimación imparcial de segunda etapa como mínimos cuadrados.

Literatura: consulte la sección “Selección de variables” en Varian, Hal R. 2014. “Big Data: nuevos trucos para la econometría”. Journal of Economic Perspectives, 28 (2): 3-28.

Si. Se llama regresión de cresta para modelos de regresión. Sin embargo, encontrará la discusión general de los problemas relacionados referidos como “problema de identificación”. Dependiendo del problema en cuestión, existen varios acercamientos para resolverlo. Muy a menudo se utiliza el razonamiento económico para legitimar la introducción de ecuaciones adicionales.

More Interesting

¿Es posible compilar una función NumPy para TensorFlow como PyAutoDiff para Theano?

¿Cómo funciona el algoritmo de recomendación de YouTube?

¿Por qué las personas usan Keras en el back-end de TensorFlow y no solo en TensorFlow?

¿Qué es la agrupación de datos?

¿Cuáles son algunos problemas de Kaggle que ayudarán a un principiante a avanzar?

¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV

¿Cuáles son las revistas científicas mejor calificadas para Machine Learning / Data Science?

Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python

¿Cuál es el mejor lenguaje de programación para el aprendizaje automático? ¿Qué idioma es mejor para programar microcontroladores y otras partes de hardware?

¿Cómo se puede modelar la interacción Radar y Jammer a través del aprendizaje automático?

¿Cuáles son los conjuntos de datos beneficiosos para el análisis de sentimientos de Twitter como proyecto de análisis de datos?

¿Cuáles son las desventajas de tener un tamaño de paso constante para el Descenso de gradiente estocástico?

Cómo medir el rendimiento de aprendizaje en Q-Learning

Cómo implementar una capa de deconvolución con los mismos valores de peso de la capa de convolución anterior para una red neuronal convolucional

¿Son las redes neuronales modelos paramétricos o no paramétricos?