¿Cuál es la importancia del análisis de componentes principales (PCA) en el modelado predictivo?

PCA es una técnica de reducción de dimensionalidad. Esto significa que podemos reducir la cantidad de atributos o características en nuestro marco de datos.

¿Porqué necesitamos esto? Debido a limitaciones computacionales.

Sabemos eso: cuantas más funciones, mejor será la predicción.

Pero muchas veces, especialmente en la producción, necesitamos encontrar un punto medio entre el poder computacional y la capacidad predictiva.

(Esto depende de muchos otros factores, por ejemplo: nuestra declaración del problema, nuestra precisión requerida, etc.)

Por lo tanto, para hacer que el proceso sea computacionalmente eficiente al reducir el número de características, podemos hacer predicciones relativamente más rápidas en cualquier modelado predictivo.

Pequeño ejemplo: en el procesamiento de imágenes para el reconocimiento de dígitos (ejemplo, conjunto de datos mnist), no siempre usamos todos los píxeles como datos de entrada, aquí usar pca puede hacer que nuestro modelo sea computacionalmente eficiente.