Cómo explicar la diferencia entre RPCA y PCA

Editar: Doh, me acabo de dar cuenta de que podrías estar preguntando sobre Robust-PCA y no sobre la regresión de componentes principales (también conocida como regression-PCA). Para lo que vale, aquí hay una respuesta sobre esto último.

A veces, durante la regresión, los grupos de variables de entrada ( covariables) serán colineales (ver otra pregunta sobre multicolinealidad). Esto significa que las entradas que son muy predictivas entre sí implican un tipo de redundancia desde el punto de vista de la salida: si puede predecir [matemáticas] y [/ matemáticas] bien con [matemáticas] x [/ matemáticas] , no necesita otra copia cerrada de [math] x [/ math].

Desafortunadamente, la regresión de OLS ve eso e intenta compensar asignando una responsabilidad similar a las entradas colineales. En el ejemplo anterior, piense en cuántos planos diferentes existen que son casi óptimos (en el sentido de mínimos cuadrados) …

Infinito, ¿verdad? Cualquier plano que pase a través de los puntos, independientemente de la rotación alrededor de los puntos verdes: imagine un tipo de eje anclado en el aire que atraviesa los puntos verdes y luego el plano rojo gira sobre él.

Para empeorar las cosas, al perturbar un poco los datos, los pesos de regresión final, que esencialmente controlan el gradiente del plano, podrían ser muy diferentes. Esto indica que el modelo es inestable .

Entonces, ¿cuál es una forma de combinar principios? variables de entrada que se correlacionan? Bueno, esto es lo que hará Regression-PCA:

Primero, hará PCA en las entradas (los puntos azules), es decir, encontrará una línea azul en el plano XZ para proyectar los puntos azules (de modo que se minimice la distancia de proyección total). Esta línea ahora actúa como un nuevo eje: llámelo [math] b [/ math],

y el problema de regresión original ahora se resuelve en el marco de referencia de [math] por [/ math], una regresión lineal de variable única.

Entonces, en cierto modo, dejamos que PCA encuentre esos grupos de variables similares, en lugar de dejarlo en manos de OLS con el peligro inherente de inestabilidad ilustrado anteriormente.

Finalmente, para replantear la regresión al espacio original [math] xzy [/ math], cualquier coeficiente de regresión que se le haya dado a la variable derivada b (aquí es 0.5), se compartirá equitativamente de acuerdo con los pesos del eje derivado de PCA (entonces los pesos finales de RPCA serán [matemática] (0.25, 0.25) [/ matemática]).

More Interesting

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

¿Cuál es la ley cero del algoritmo de aprendizaje automático (MLA)?

¿A qué laboratorio puedo unirme en Caltech para hacer investigación de aprendizaje automático?

Aparte del aprendizaje automático, ¿cuáles son algunos campos de la informática que requieren conocimientos matemáticos?

¿Realizar el blanqueamiento de datos antes del entrenamiento mejora la capacidad de generalización de un SVM?

¿Son las redes neuronales artificiales la única forma de establecer un aprendizaje profundo?

Cómo tener una buena inicialización de la probabilidad previa, la probabilidad de emisión en los modelos ocultos de Markov ya que los HMM son óptimos locales

Como dicen, cada función posible se puede modelar con una percepción de 2 capas, en teoría, ¿se puede modelar una función del universo en una red neuronal con 2 o 3 capas de profundidad?

¿Por qué usamos k-means clustering? ¿Qué usos tiene en un escenario del mundo real?

¿Qué aplicaciones prácticas ve para ejecutar los modelos TensorFlow en un teléfono inteligente?

¿El aprendizaje por refuerzo es meta-aprendizaje?

¿Será el hardware especializado para el aprendizaje profundo un cambio de juego?

¿Es el análisis de sentimientos todo sobre lingüística?

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cuáles son los pensamientos de Yoshua Bengio sobre los modelos gráficos probabilísticos?