¿Necesita normalización de características después de la reducción de dimensiones para la clasificación?

En primer lugar, PCA está destinado a la transformación de dimensionalidad y no a la reducción. Puede elegir los componentes más importantes y llamarlo características seleccionadas, pero no están en el espacio de características original.

En segundo lugar, sí normaliza la función porque las diferentes funciones tienen escalas diferentes, por ejemplo, la Característica1 es la edad y Fetaure2 es el ingreso. Digamos que la edad es entre 1 y 100 y el ingreso entre $ 1000 a $ 100000. En este caso quieres hacer la normalización. Un efecto secundario de la normalización es la pérdida de información, por lo que debe tener cuidado.

Por último, la normalización de características se realiza antes de emplear cualquier método de transformación o selección de características y antes de entrenar. Entonces, primero escala las características, luego ejecuta PCA o lo que sea, y luego realiza la capacitación.

Editar

¿Pensé en compartir este enlace que mencioné en los comentarios: PCA primero o normalización primero?

HTH

¿Tiene sentido usar la selección de características antes de Random Forest?

Cómo interpretar la trama de ACF

Las redes neuronales se han vuelto muy populares en los últimos años, sin embargo, gran parte de la teoría se desarrolló hace 20 años. ¿Qué avances explican los éxitos recientes?

¿Cómo puedo demostrar que si no escalo las características antes de aplicar el descenso de gradiente, disminuirá la convergencia?

¿Qué algoritmo de aprendizaje automático se debe usar para eliminar palabras innecesarias en una consulta de búsqueda realizada para recuperar datos de un texto grande?

Quiero trabajar con Inteligencia Artificial General, ¿qué necesito aprender para lograr esto?

En mi opinión, la normalización debe aplicarse antes de aprender los vectores básicos de PCA / LDA. Supongamos que está utilizando PCA para la reducción de la dimensionalidad, y supongamos que para todos los puntos de datos, una de las dimensiones tiene valores que son muy grandes en comparación con otras dimensiones. Si no aplica la normalización antes de encontrar los vectores propios, se centrarían más en esta dimensión de gran valor en comparación con otros. Por lo tanto, los vectores propios no capturarían la información presente en otras dimensiones.

Vivekanand Mishra

La normalización es siempre una buena idea. El único objetivo que logran las PCA y otras técnicas de reducción de dimensiones es justamente eso; reduciendo las dimensiones de su espacio de funciones, reduciendo así el costo y el tiempo computacional. Si decide o no normalizar los datos es un asunto completamente independiente.
En resumen, no omita la normalización.

Vivekanand Mishra

More Interesting

¿Cuáles son los mejores solucionadores de programas cuadráticos?

¿Qué son las máquinas complejas?

¿Cuál es la diferencia entre el paralelismo del modelo y el paralelismo de datos?

Cómo detectar si a una cadena le faltan espacios entre palabras

¿Cuáles son las historias de éxito del aprendizaje profundo para el procesamiento del lenguaje natural y los marcos y bibliotecas utilizados o creados por ellos?

¿Cuál es la diferencia entre el aprendizaje probabilístico y el aprendizaje no probabilístico para diferentes situaciones? ¿Cuándo es uno más apropiado que el otro?

¿Cuáles son los mejores métodos de detección de anomalías para imágenes?

¿Qué piensan los científicos de los expertos en SEO?

¿Qué es una comprensión intuitiva del análisis factorial?

¿Cómo se puede usar una distribución como una característica para la clasificación en el aprendizaje automático?