Después de seleccionar entidades con una regresión regularizada, ¿es mejor estimar el resultado con la misma regresión regularizada o con una regresión no regularizada?

A menudo hay dos tipos de preguntas en las que uno puede estar interesado cuando se realiza una regresión dimensional alta

  1. Selección de variables, es decir, ¿está la variable en el modelo?
  2. ¿Qué tan grande es el coeficiente de regresión asociado con la variable?

Los métodos de estimación penalizados (particularmente la penalización \ ell-1) reducen considerablemente los coeficientes de las variables verdaderas en el modelo, especialmente aquellas con valores de coeficientes grandes. Por lo tanto, para la segunda pregunta, a menudo es más útil realizar una proyección de mínimos cuadrados sobre las características seleccionadas por una estimación regularizada. Esto no sería necesario si su objetivo es 1.

Realizar la proyección de mínimos cuadrados es útil para obtener mejores predicciones ya que el modelo proyectado de mínimos cuadrados tiene coeficientes que no son tan reducidos.

La advertencia:

Debe tener en cuenta la posibilidad de que la estimación regularizada sea incorrecta. Si la estimación regularizada tiene falsos negativos (coeficientes cero para componentes verdaderamente distintos de cero) o falsos positivos (coeficientes distintos de cero para componentes verdaderamente cero), la proyección de mínimos cuadrados subsiguientes puede ser engañosa. Tratar con este “sesgo de proyección” engañoso es ahora un tema candente en las estadísticas de alta dimensión. Por lo tanto, es extremadamente difícil cuantificar la incertidumbre de una estimación proyectada de mínimos cuadrados.

En particular, no puede realizar pruebas t en estas estimaciones proyectadas de mínimos cuadrados, ya que la prueba t no tiene en cuenta los errores que se arrastran en la selección del modelo o los coeficientes penalizados.

More Interesting

¿Cómo puede alguien usar los datos de la secuencia de genes para encontrar genes responsables de una enfermedad genética en particular?

¿Dónde puedo encontrar algunas empresas que trabajen con técnicas de aprendizaje automático y minería de datos, en el campo biomédico?

¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

¿Qué es un gran blog para el aprendizaje automático?

Cómo usar el procesamiento del lenguaje natural (PNL) para resumir un documento en una serie de ideas principales

¿Qué significa 'alineado suavemente' en un contexto de aprendizaje profundo?

Cómo construir un conjunto de datos para el aprendizaje automático

¿Cómo explicaría la desigualdad de Hoeffding y, como consecuencia natural, la dimensión Vapnik Chervonenkis a un niño de diez años?

¿A quién demuestra que los núcleos radiales son núcleos válidos? ¿Cómo se muestra esto mediante la integración de características?

¿Por qué las técnicas de optimización como el gradiente natural y los métodos de segundo orden (L-BFGS por ejemplo) no se usan mucho en el aprendizaje profundo?

¿Qué computadora portátil debo comprar, la Dell XPS 15 o la MacBook pro 13 '2017 para una Maestría en Ciencias de la Computación, en los EE. UU. Con enfoque en aprendizaje automático y ciencia de datos?

Cómo utilizar una GPU en mis algoritmos de aprendizaje automático de R

¿Cómo funcionan las redes interbancarias?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.