Visión por computadora: ¿Qué parámetros se pueden usar para medir qué tan similares son dos imágenes?

Creo que una mejor manera de hacer la pregunta es: “¿Qué algoritmos se pueden usar para medir qué tan similares son dos imágenes?” Los parámetros generalmente se refieren a números dentro de algún algoritmo o modelo.

En nuestra investigación, descubrimos que una excelente manera de medir la similitud entre dos imágenes es calcular primero los descriptores HOG para dos imágenes y luego aprender una métrica de similitud para compararlas. También comparamos con un algoritmo de coincidencia de imágenes basado en SIFT. Cualquier tipo de medida de similitud sobre píxeles sin procesar o histogramas de color no es tan poderoso como un enfoque basado en SIFT / HOG / GIST. Publicamos este algoritmo en SIGGRAPH ASIA 2011 y está basado en mi trabajo de doctorado en Exemplar-SVM de ICCV 2011.

Consulte la página del proyecto (que tiene enlaces a videos y código):
Similitud visual basada en datos para la coincidencia de imágenes entre dominios

SSIM: similitud estructural
Ref: similitud estructural

Es un mejor índice si está buscando comparar imágenes en términos de cuán similares son visualmente, que algo como PSNR o SSD.

SIFT: escala de transformación de característica invariable
Ref: transformación de característica invariante de escala

Este algoritmo encuentra aplicaciones en reconocimiento de objetos, unión de imágenes (panorama) y otras que requieren describir el contenido de la imagen.

Depende de hasta qué punto desea cuantificar la similitud. Si solo está buscando similitud visual, algo como SSIM hará. Para obtener más caracterización, debe optar por SIFT.

Básicamente, desea ver las métricas de registro: información mutua, correlación cruzada, suma de diferencias cuadradas, etc. La elección dependerá de qué tipo de similitud esté buscando: coincidencia de intensidad exacta (SSD) o cualquier tipo de no lineal partido de intensidad (MI).

Todas estas métricas requieren que se registren las imágenes. Probablemente podría usar funciones como SIFT para medir la similitud de las imágenes sin registro. Sin embargo, esto está fuera de mi área de especialización.

Joel realmente respondió muy bien. Me gustaría referirlo a HoG (Histograma de gradientes orientados), que es una técnica bastante más nueva (2005 en adelante, supongo) y Covarianza de Región.

Pero la pregunta subyacente sería cuáles son esas dos imágenes. Si son imágenes en color con solo un poco de traducción, entonces SSD funcionaría. Si son imágenes similares con mucha rotación y escala involucradas, SIFT / SURF son mejores técnicas.

1. http://en.wikipedia.org/wiki/His
2. http://www.merl.com/reports/docs

Pregúntale a un humano.