¿Por qué se utilizan imágenes en escala de grises para el análisis de componentes principales?

Cuando se realiza PCA en imágenes, uno tiene que construir un vector “plano” de características, donde la intensidad de cada píxel es una característica y cada imagen se representa como un vector plano (no una matriz). Por ejemplo, si tiene imágenes en escala de grises de 16 × 16, debe transformar esto en vectores de 256 valores y realizar PCA en esos datos.

En cuanto a los colores, aunque rara vez se usa, realmente no creo que sea un problema. Supongamos que tiene una matriz de píxeles de 16 × 16 que almacena cada uno tres valores (rojo, verde y azul). Para cada imagen que da 16x16x3 = 768 características. Puede ordenar las características de tal manera que en la primera columna habrá la intensidad del canal rojo en la primera fila de la primera columna, luego verde en el mismo lugar, luego azul, luego la segunda columna en el canal rojo de la primera fila, etc. se trata de representar los datos en un vector “plano” y no en una matriz multidimensional.

En cuanto al software, recomiendo scikit-learn: tiene un paquete para reconocimiento de imágenes y PCA.

Related Content

Cómo integrar el marco Tensorflow con XGBoost

¿Los ingenieros de aprendizaje automático en Google tienden a publicar artículos?

¿Qué es una explicación intuitiva del impulso en el entrenamiento de redes neuronales?

¿En qué se diferencia el aprendizaje profundo de la propagación por error (error)?

¿Por qué decimos que la máquina de vectores de soporte y muchas otras técnicas de aprendizaje automático tienen un supuesto subyacente de iid?

¿Cuál es la relación entre la teoría de la Gestalt y el aprendizaje profundo?

¿Cuáles son algunos marcos de aprendizaje profundo con solo CPU?

More Interesting

¿Cuál es la entrada para un clasificador Naive Bayes?

¿Qué es el procesamiento de señales y cómo se relaciona con el aprendizaje automático?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

Cómo obtener la distribución de probabilidad de clases con píxeles que son 0 o 255

Cómo obtener colores 'visualmente distinguibles' de las imágenes

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

En finanzas cuantitativas, ¿hay alguna analogía entre la optimización de la cartera y el análisis de componentes principales?

Estoy creando una plataforma de transmisión en vivo: ¿cómo puedo conectarme y usar varias cámaras web al mismo tiempo?

¿Cuál es la relación de la función objetivo de muestreo negativo con la función objetivo original en word2vec?

¿Cuáles son algunos ejemplos de aprendizaje automático en operaciones de computación en la nube?

¿Por qué un algoritmo evolutivo es un método inapropiado para usar cuando se busca una clave para descifrar un mensaje codificado cuando solo hay una respuesta correcta?

¿Cuán sensible es el análisis de componentes independientes (ICA) a la simultaneidad de la señal de entrada?

¿Qué tipo de problemas han funcionado bien con Bayesian Networks?

¿Por qué no estamos usando el coeficiente beta como una selección de características?

¿Hay conjuntos de datos abiertos que contengan textos y calificaciones de los usuarios para ellos?

Web Analytics