PCA, 2DPCA vs PCA multilineal: ¿Por qué las imágenes se vectorizan antes de realizar PCA, ICA o LDA, etc.? ¿Por qué no simplemente concatenar imágenes 2D en una matriz?

Una manera fácil de realizar PCA es obtener los datos en una matriz cuyas filas representan ejemplos de aprendizaje y las columnas representan características. Luego solo realiza la Descomposición de valor singular en esa matriz.

Si desea usar datos de imágenes originales (matrices), deberá usar 2 dimensiones para almacenar un ejemplo de aprendizaje. Entonces, para almacenar muchos ejemplos, debe usar una tercera dimensión. De esta manera, termina con una matriz 3D de números indexados por el número de un ejemplo y coordina x e y en una imagen dada. Esa es una matriz tridimensional. SVD es una operación definida para matrices (matrices 2D) no matrices 3D.

No conozco ninguna forma de realizar PCA directamente en matrices de matrices de imágenes. Y, francamente, no creo que necesitemos uno. Siempre puede cambiar la forma de la matriz de imagen en un vector y luego realizar el PCA. De esta manera, solo tenemos un algoritmo que es independiente de la estructura del problema particular; no importa si está analizando imágenes, sonido o ADN humano, siempre está utilizando el mismo algoritmo PCA bien conocido e implementado. La única tarea que debe hacer es proporcionarle los datos de entrada correctos.

Para resumir:

Dudo que exista algún algoritmo similar a PCA que funcione con matrices 3D.
Incluso si hay un algoritmo como ese, no tiene sentido usarlo, ya que puede transformar fácilmente el problema convirtiendo las imágenes en vectores.

Related Content

¿Puedes explicar el descenso coordinado en términos simples?

En las arquitecturas VGG-16 y VGG-19, ¿por qué hay más capas convolucionales 3 × 3 apiladas consecutivamente en las capas altas que en las capas inferiores?

¿Cuál es el punto de probar los datos en k-fold cross validation?

¿Qué significa el espacio de hipótesis en Machine Learning?

¿Qué tipos de características se extraen de los archivos de voz utilizando predicción lineal y predicción no lineal?

¿Cuáles son las diferencias entre los cursos de Ingeniería Informática (CSE) e Ingeniería Informática (CE)?

Mientras estudia CS o aprende un nuevo lenguaje de programación, ¿vale la pena escribir código de un ejemplo?

More Interesting

¿Cuáles son las diferencias entre los árboles de decisión, los métodos de agrupamiento y las redes neuronales?

¿Qué tamaño debería tener mi bosque aleatorio aproximadamente si tengo 17 variables y medio millón de registros?

¿Qué tan buenos antecedentes en ML ofrece el curso Coursera Machine Learning a alguien?

Cómo identificar entidades en una consulta de búsqueda en lenguaje natural

¿El descenso de gradiente de lote completo, con potencia de computadora ilimitada, es siempre mejor que el descenso de gradiente de mini lote?

¿Es el aprendizaje automático una mejor forma o técnica para comprender los datos y hacer pronósticos que las estadísticas?

¿Qué tan útil es el aprendizaje automático?

Cómo entrenar algoritmos relacionados con IA sin una GPU decente

¿Alguien puede proporcionar ejemplos sobre cómo usar la biblioteca Shogun para modelos de Markov ocultos?

¿Podría la IA volverse autónoma y aprender y adaptarse de manera no supervisada a través del aprendizaje profundo?

Cómo reducir la dimensionalidad en la agrupación promedio global para que coincida con el tamaño de softmax

¿Cuáles crees que son los campos más emocionantes del aprendizaje automático fuera del aprendizaje profundo?

¿Cuál es la mejor manera de manejar los valores atípicos en Machine Learning?

Neil Lawrence: ¿Qué opinas sobre la relación entre las estadísticas y el aprendizaje automático?

¿Qué tan rápido es Theano en comparación con otras implementaciones de DBN? ¿Cómo se compara con otras implementaciones de GPU (potencialmente no públicas) para la velocidad de entrenamiento en grandes conjuntos de datos?

Web Analytics