¿Por qué medios se puede realizar una regresión de alta dimensión (#características >> #observaciones) que no sea la regularización (LASSO, regresión de cresta, etc.)?

Por lo general, los problemas de alta dimensión están subdeterminados, es decir, un tamaño de muestra mucho más pequeño que la dimensionalidad [matemática] n << p [/ matemática]. Por lo tanto, algunas restricciones son necesarias para incluso determinar el problema. La forma en que funciona la regularización es que hace que la dimensionalidad intrínseca del problema sea pequeña, de modo que permanece solucionable en el espacio de alta dimensión.

Considere un ejemplo simple, resolviendo un sistema lineal de ecuaciones [math] \ mathbf {y} = A \ mathbf {x} [/ math]. Si [math] A [/ math] es gordo , es decir, [math] n << p [/ math], entonces el problema está subdeterminado. Ahora, considere que alguien le dice que el 90% de las columnas en [matemáticas] A [/ matemáticas] son simplemente transformaciones lineales del otro 10%. Esta es una restricción estructural sobre el problema. En ese caso, puede hacer PCA, reducir la dimensionalidad a la mitad y resolverlo. Sin embargo, en general, incluso si puede adivinar que algunas columnas son linealmente dependientes, no puede determinar explícitamente esta fracción (es decir, 90%). En tales escenarios, un buen regularizador ayudará. En este caso, por ejemplo, LASSO hará un desastre, ya que hay tantas covariables correlacionadas. Mientras que la regresión de PCA puede ser excelente.

Análisis de datosAprendizaje automáticoEstadísticainformáticaProbabilidadRegresiónRegresión lineal

Related Content

Mapas: ¿Dónde podemos encontrar la lista de todos los pueblos de la India con su longitud y latitud?

¿Qué significa la hipótesis específica y general en el concepto de espacio de versión del aprendizaje automático?

¿Se beneficiaría el plan de estudios general de informática de la universidad al dividirse en pistas CS aplicadas y puras?

¿Cuál es la intuición detrás de la Regla del producto en combinatoria?

¿Cómo se utilizan las técnicas de aprendizaje automático en el comercio?

¿Hay algún solucionador que minimice la función objetivo [matemática] f (x) = \ matemática {e} ^ x [/ matemática] donde [matemática] x> 0 [/ matemática]?

¿Cómo podría uno enseñar la administración del sistema a alguien que nunca antes ha usado una computadora?

Existe MARS, que es una modificación de los árboles de regresión.

MARS funciona bien en grandes dimensiones, pero no estoy seguro de cuán estable es cuando el número de parámetros es> observaciones.

Soumyadeep Chatterjee

More Interesting

Pero, ¿podría Alan Turing interpretar a Benedict Cumberbatch en una película biográfica?

¿Cómo mejora el rendimiento de la computadora para manejar dispositivos de baja velocidad?

¿Qué habilidades tangibles no específicas de la plataforma adquieren los informáticos a través de su educación universitaria?

¿Cómo puedo escribir un script de shell para recuperar texto que se encuentra entre dos cadenas?

¿Cuáles son los enfoques actuales para resolver problemas completos de NP?

¿Qué hace que la computadora funcione?

¿Cuáles son los límites computacionales de una computadora?

MySQL ¿La normalización de una base de datos reduce su velocidad o la aumenta y puede normalizarse en exceso?

¿Hay alguna diferencia entre https en la URL y algo escrito en un cuadro verde?

¿Cómo chicos como Peter Thiel y Reid Hoffman, sin experiencia en informática, formaron empresas tecnológicas exitosas?

¿Cuál es la diferencia entre un modelo de datos y un esquema de base de datos?

¿Puede una teoría de categoría proporcionar el marco para vincular ontologías?

Las matemáticas de aprendizaje automático utilizan números reales, pero las computadoras son digitales. ¿Por qué es esto? ¿Podría ser diferente?

¿Qué startups reclutan estudiantes universitarios con experiencia en aprendizaje automático?

¿Cuál es el origen del nombre "Informática"?

Web Analytics