¿Necesita normalización de características después de la reducción de dimensiones para la clasificación?

En primer lugar, PCA está destinado a la transformación de dimensionalidad y no a la reducción. Puede elegir los componentes más importantes y llamarlo características seleccionadas, pero no están en el espacio de características original.

En segundo lugar, sí normaliza la función porque las diferentes funciones tienen escalas diferentes, por ejemplo, la Característica1 es la edad y Fetaure2 es el ingreso. Digamos que la edad es entre 1 y 100 y el ingreso entre $ 1000 a $ 100000. En este caso quieres hacer la normalización. Un efecto secundario de la normalización es la pérdida de información, por lo que debe tener cuidado.

Por último, la normalización de características se realiza antes de emplear cualquier método de transformación o selección de características y antes de entrenar. Entonces, primero escala las características, luego ejecuta PCA o lo que sea, y luego realiza la capacitación.

Editar

¿Pensé en compartir este enlace que mencioné en los comentarios: PCA primero o normalización primero?

HTH

En mi opinión, la normalización debe aplicarse antes de aprender los vectores básicos de PCA / LDA. Supongamos que está utilizando PCA para la reducción de la dimensionalidad, y supongamos que para todos los puntos de datos, una de las dimensiones tiene valores que son muy grandes en comparación con otras dimensiones. Si no aplica la normalización antes de encontrar los vectores propios, se centrarían más en esta dimensión de gran valor en comparación con otros. Por lo tanto, los vectores propios no capturarían la información presente en otras dimensiones.

La normalización es siempre una buena idea. El único objetivo que logran las PCA y otras técnicas de reducción de dimensiones es justamente eso; reduciendo las dimensiones de su espacio de funciones, reduciendo así el costo y el tiempo computacional. Si decide o no normalizar los datos es un asunto completamente independiente.
En resumen, no omita la normalización.