Cómo aplicar en la práctica PCA a la agrupación de trayectorias

Sí, el periódico lo dice claramente. Debe 1) tener trayectorias de dimensionalidad fija, en este caso 2L (porque los valores x e y). Luego pones todos tus valores (x, y) formando un vector en el espacio R ^ 2L. Esto es enorme y el rendimiento de distancia euclidiana (o vecino cercano) se degrada en espacios de alta dimensionalidad. La solución es aplicar un razonamiento heurístico: “las dimensiones con mayor variación a lo largo de mis muestras son las dimensiones más valiosas”. Este razonamiento también tiene un punto de vista de error de representación.
Entonces usa PCA (SVD) para mantener el 95% de la energía (ese es el vector propio superior que representa los valores propios del 95%). Luego proyecta que apunta a este subespacio (N valores propios superiores) obteniendo observaciones con solo N dimensiones. En esta (mucho más baja) dimensionalidad NN y puede ser más precisa.

si trabaja en agrupación / clasificación de secuencia de longitud variable, le recomiendo el trabajo de Eamonn Keogh
Eamonn Keogh

More Interesting

¿Qué es el aprendizaje automático en términos simples?

¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?

¿Es útil para un científico de datos conocer métodos ágiles como Scrum?

¿Quién usa OpenNLP?

¿Existe alguna técnica de aprendizaje automático que pueda transferir automáticamente una historia escrita en texto a un libro de dibujos animados?

Sistemas de recomendación: ¿Cuál es la diferencia entre el filtrado colaborativo de elemento a elemento y el filtrado basado en contenido?

¿Cómo detectamos el sobreajuste y la falta de ajuste en Machine Learning?

¿Por qué la mayoría de las declaraciones de investigación de aprendizaje automático suenan a mierda?

¿Cuál es una buena manera de entender esta optimización mediante el uso de un multiplicador lagrangiano?

¿Cómo escapa / resiste una red neuronal profunda a la maldición de la dimensionalidad?

¿La investigación actual sobre el procesamiento del lenguaje natural gira principalmente en torno al aprendizaje profundo? Si no, ¿cuáles son las técnicas modernas alternativas?

Cómo explicar la diferencia entre RPCA y PCA

Cómo comenzar con el aprendizaje profundo (cosas matemáticas) en Python

¿Cuáles son las ventajas de aprender el aprendizaje automático desde el punto de vista profesional?

¿Por qué Python es tan brillantemente superior a R en aprendizaje automático y tan totalmente inferior en estadística médica e investigación de drogas?