En una oración, “HOG es una versión comprimida y codificada de su imagen”
Si ya conoces un poco la visión por computadora, entonces mira el video del profesor Mubarak Shah,
Centro de Investigación en Visión por Computador de la Universidad de Florida Central
Si eres completamente nuevo en Computer Vision, sé mi lector.
Gradientes de imagen:
En sentido simple, un gradiente es más o menos una derivada. (Los matemáticos se van …)
Por lo tanto, un gradiente de imagen en cualquier ubicación de una imagen, le proporciona el cambio de intensidad en esa ubicación, ya que el gradiente es una cantidad vectorial que tiene magnitud y dirección.
Para más información y matemáticas: gradiente de imagen
Gradientes Orientados:
Cuando hablamos de magnitud, nos referimos a los gradientes como solo gradientes. Cuando consideramos sus orientaciones, los referimos como gradientes orientados (orientación de gradiente).
Ahora en “Histograma de gradientes orientados”, sabemos qué son los gradientes orientados.
Histograma de gradientes orientados:
Un histograma no es más que un gráfico b / w de los valores en la tabla a la frecuencia de sus repeticiones.
Entonces, tome una pequeña porción de una imagen (también llamada parche), encuentre las orientaciones de gradiente y luego trace un histograma de sus orientaciones. Lo que te dice es, la probabilidad de existencia de un gradiente con orientación específica en ese parche.
Dimensionalidad :
Pero el problema es que si solo trazamos las orientaciones en bruto en el histograma, no tendrán mucho sentido. Además, la longitud del histograma sería demasiado alta. Entonces, en su lugar, dividimos las orientaciones (que son -180 a +180) en bloques (es decir, 0-30 un bloque, 30-60 otro, etc.)
Preservación de relaciones especiales:
Para preservar la información de las estructuras locales, extraemos las características en bloques pequeños de manera repetitiva. Finalmente, concatenamos todas estas características de bloques en un vector largo.
Más información,
Histograma de gradientes orientados
Cómo HOG puede diferenciar objetos del resto de las imágenes.
HOG es una técnica de extracción de características. Eso significa que HOG es una versión comprimida y codificada de su imagen. Lo que necesitamos es un algoritmo de aprendizaje, un algoritmo que pueda diferenciar dos conjuntos de características. Un algoritmo que puede trazar una línea entre dos clases separadas de características. Un tipo de algoritmo de este tipo es Support Vector Machines. Lo que suele hacer es tomar características de imágenes de personas (o cualquier conjunto de imágenes de un objeto) y algún conjunto de imágenes aleatorias (donde el objeto que desea detectar no está allí) e intentará dibujar una línea de separación entre Estas dos clases.
Entonces, en tiempo real, cuando le da una imagen de una persona, primero extraemos las características de HOG y luego se la daremos a un SVM capacitado y verificaremos si la característica está cerca de imágenes de personas vistas anteriormente o cerca de imágenes aleatorias .
Máquinas de vectores soporte