¿Podemos combinar HOG y PCA en la clasificación de imágenes?

Necesita aclarar su pregunta un poco. Sin más información, no creo que nadie pueda ayudarte.

  1. “Usé Gaussian Naive Bayes y Gaussian Bayes. El resultado es bastante bajo (29.7% y 36.4% correspondientemente) ” – ¿Qué tipo de características HOG usó? (Tamaño de celda, tamaño de contenedor, número de orientación, variación Dalal-Trigg, etc.)
  2. “Uso HOG como descriptor global” . ¿Entonces no usaste HOG como descriptor global en el punto (2)? ¿Cómo usaste HOG en el (2) experimento entonces?
  3. ¿Cómo y por qué utilizaste Gaussian Naive Bayes para clasificar en realidad? Las personas solo lo usan si saben que la distribución de datos es en realidad gaussiana. Hasta donde yo sé, CIFAR-10 está lejos de eso. Bajo el supuesto de que la distribución de datos es gaussiana, es muy difícil para el clasificador, es decir, Naive Bayes o Bayes, ir mejor.
  4. Naive Bayes trabaja bajo otra suposición de que todas sus características son independientes. Este podría no ser el caso de HOG.

Bueno, realmente no estoy siguiendo tu pregunta, pero hay un descriptor llamado descriptor HoG-PCA. Compruébalo aquí:

Detección ocular eficiente utilizando el descriptor HOG-PCA (descarga en PDF disponible)

Resumen:

La detección ocular se está volviendo cada vez más importante para las interfaces móviles y la interacción de la computadora humana. En este artículo, presentamos un detector ocular eficiente basado en las características de HOG-PCA obtenidas al realizar el Análisis de componentes principales (PCA) en el histograma de gradientes orientados (HOG). El histograma de gradientes orientados es un descriptor denso calculado en bloques superpuestos a lo largo de una cuadrícula de celdas sobre regiones de interés. El HOG-PCA ofrece una función eficiente para la detección ocular al aplicar PCA en los vectores HOG extraídos de los parches de imagen correspondientes a una ventana deslizante. El descriptor HOG-PCA reduce significativamente la dimensionalidad de la característica en comparación con la dimensionalidad de la característica HOG original o la región de la imagen del ojo. Además, presentamos el descriptor HOG-RP utilizando proyecciones aleatorias como una alternativa a PCA para reducir la dimensionalidad de las características de HOG.

http: //www.contrib.andrew.cmu.ed

More Interesting

¿Los grandes ingenieros de aprendizaje automático siempre leen nuevos trabajos de investigación sobre ML?

¿Cuándo necesitamos tener un mayor número de unidades ocultas que el número de unidades de entrada y viceversa?

¿Qué es la regresión de Ridge en términos simples?

¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

¿Existe alguna técnica de aprendizaje automático que pueda transferir automáticamente una historia escrita en texto a un libro de dibujos animados?

¿Es un 'predictor de la siguiente palabra' que hice el aprendizaje automático o el procesamiento del lenguaje natural?

¿Qué deparará el futuro para los desarrolladores en la era del aprendizaje profundo y la IA? ¿Cuáles serán las tendencias y cómo sobrevivirán los desarrolladores?

¿Qué sucede si hacemos que la forma de una función de activación sea diferente en cada capa, permitiendo que también se aprenda su forma, si las capas superiores tienen menos unidades, haciéndolas más no lineales?

Después de las estructuras de datos y algoritmos (DSA), ¿qué debo aprender (ML, AI, ciencia de datos)? ¿O debería comenzar a hacer algunos proyectos sobre cosas que ya he aprendido?

¿Qué trabajo puede hacer un ingeniero de aprendizaje automático para ayudar a las personas?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

¿Es posible conseguir un trabajo en Machine Learning sin experiencia laboral?

¿Son los modelos de aprendizaje profundo / redes neuronales siempre superiores en las tareas de PNL?

Si estuviéramos usando un SVM no lineal, ¿cuáles son los hiperparámetros? ¿Cómo elegiríamos los hiperparámetros correspondientes? (funciones de referencia utilizadas)

Cómo clasificar micro-textos (tweets, preguntas, etc.)