¿Es adecuado usar un algoritmo de hash perceptual para desarrollar un motor de búsqueda de imágenes?

Creo que los objetivos de un hash perpetuo están algo desalineados con la búsqueda.

La mayor parte del trabajo sobre hash perceptual se orienta en torno al caso de uso “encontrar el mismo medio, incluso si sufre alguna transformación”. Es decir, ¿podemos identificar el mismo archivo de video incluso si está codificado de nuevo? ¿Podemos decir si dos imágenes difieren solo mediante la adición o eliminación de una marca de agua o crédito?

Por lo tanto, si la aplicación de búsqueda es solo “en qué otro lugar de Internet se produce esta imagen en particular”, entonces debería estar bien.

Sin embargo, espero que el objetivo de la búsqueda de imágenes sea más amplio, algo así como “encuéntrame imágenes con contenido similar a este”. Ese es un problema mucho más difícil. Dos imágenes de la misma especie de flor pueden ser fácilmente reconocibles por los humanos, pero no necesariamente tienen hashes perceptuales similares. Las características extraídas por los hash perceptuales pueden no ser particularmente significativas para los humanos como una métrica de similitud.