¿Qué es un componente principal y por qué se llama así?

Es ilustrativo imaginar lo que está sucediendo con un ejemplo tremendamente hipotético.

Imagine que tiene un arquitecto loco que quiere construir un rascacielos en una montaña muy empinada que tiene una pendiente de 10. Es decir, a medida que avanza hacia la montaña, hará 1 metro de progreso horizontal y 10 metros de progreso vertical.

Ahora, el arquitecto loco construye un rascacielos de 20 pisos que es perpendicular a la pared de la montaña, (NO aplomado a la gravedad). Es decir, el rascacielos apunta casi horizontalmente a una pendiente de 1/10. (¡No muy práctico!). Decide instalar un ascensor, pero como está loco, marca los pisos de acuerdo con cuántas historias subes desde el VERTICAL. Eso significa que para llegar al piso 10, debe presionar el botón marcado “1”. El piso 20 sería “2”. El quinto piso se marcaría “0.5”.

Por supuesto que odias esto. Significa que el residente del piso superior solo podía jactarse de que estaba en el segundo piso. El problema es que el arquitecto loco está midiendo la altura del piso desde la perpendicular de la superficie de la tierra. Preferiría que los números de piso estuvieran más dispersos. Lo que desea es medir el piso en función de la DIRECCIÓN del edificio se eleva y no la dirección de la gravedad.

En otras palabras, desea medir los pisos que le dan el máximo cambio de piso. Entonces, en lugar de utilizar la coordenada x, y, z “estándar”, desea un nuevo sistema de coordenadas donde la longitud del edificio (20) sea el Componente Principal. Esto implica una simple rotación del sistema de coordenadas.

Este es un ejemplo artificial, ya que en la práctica, se pueden combinar, rotar y estirar / comprimir múltiples ejes en un nuevo eje.

Afortunadamente, la PCA que usa álgebra matricial proporciona rotaciones relativamente fáciles para encontrar los “mejores” nuevos sistemas de coordenadas. Si tiene suerte, podría descartar uno o más de los componentes principales si esas direcciones tienen un cambio mínimo en los datos en esa dirección.

La desventaja de PCA es que ha combinado ejes (vectores) de formas que son difíciles de interpretar, especialmente cuando tiene un gran espacio de características dimensionales.

(¡Y estás atrapado con un arquitecto loco!)

análisis de componentes principalesAprendizaje automáticoestadísticasReconocimiento de patrones