¿Por qué el hashing geométrico es más eficiente que usar una matriz indexada de las coordenadas de los puntos característicos?

Los objetos de interés en una escena pueden aparecer a diferentes escalas, ubicaciones y rotaciones (tanto rotaciones internas como externas). Durante el emparejamiento, el primer paso normalmente es detectar los llamados puntos de interés en el espacio plano de la imagen 2D. Por lo tanto, las coordenadas de entidades indexadas se referencian con respecto al plano de imagen 2D, no al marco de referencia del objeto.

Con esto quiero decir que si un objeto sufre una traslación, escala o rotación, los puntos clave detectados seguirán su ejemplo. Es decir, los puntos clave son covariantes, no invariables para esas transformaciones. Para detectar de manera confiable el objeto, necesitamos procesar los puntos característicos con respecto al sistema de coordenadas del objeto. Si utiliza las coordenadas absolutas de la entidad, deberá buscar explícitamente el objeto en múltiples escalas, rotaciones, posiciones y otras transformaciones, esto no es eficiente.

¿Cómo podemos recuperar el sistema de coordenadas del objeto? La respuesta es lo que hace el hashing geométrico al elegir 2 o más pares de puntos característicos y usarlos como base para definir un sistema de coordenadas relativo. Ese nuevo sistema de coordenadas se vuelve verdaderamente invariable para las diversas transformaciones, por lo tanto, el objeto puede ser emparejado de manera confiable.

Si usa 2 pares de bases, solo puede generar invariancia a transformaciones 2D de similitud. Para construir tolerancia a la rotación fuera del plano también necesitará 3 pares de bases. Por lo tanto, cuantos más pares de bases usamos en el hashing geométrico, más invariables se vuelven los nuevos espacios de coordenadas a diversas transformaciones. Pero apuesto a que cuantos más pares de bases se elijan, más grande será el mapa hash, por lo que 3 pares de bases son normalmente un buen lugar.

Por lo tanto, los pares de bases múltiples ayudan a combinar objetos / imágenes similares independientemente de las transformaciones complejas que se aplican al objeto / imagen.

Espero que esto ayude.

More Interesting

Quiero aprender más sobre algoritmos, pero no sé por dónde empezar. ¿Me puede dar algunas instrucciones o consejos? Gracias.

¿Por qué son necesarios los algoritmos?

Cómo guardar un árbol binario en una matriz de recorrido en orden

¿Cuál es la mejor manera de implementar una lista cerrada para un algoritmo de búsqueda en C?

¿Cuál es la diferencia entre el algoritmo de firma y el algoritmo hash de firma en un certificado SSL?

Cómo agregar dos elementos de matriz usando punteros

¿Desarrolla algoritmos comerciales después de volver a probar los datos históricos? ¿O debería buscar a través de datos históricos patrones utilizando un algoritmo?

¿Existe un formato estandarizado para representar las funciones de la computadora como algoritmos matemáticos?

¿Por qué es necesario un relleno de palabra no utilizado al comienzo del espacio de almacenamiento dinámico asignado?

¿Cómo se implementan las matrices de JavaScript internamente?

¿Qué algoritmos se pueden usar para encontrar un objeto similar en una base de datos que contenga múltiples atributos, numéricos, categóricos y no categóricos?

¿Qué tan útil es el algoritmo genético?

Cómo encontrar el número de subárboles izquierdo y derecho de un árbol binario

¿Cuál es el mejor libro de texto en línea gratuito para Algorithm an Data Structure? Me refiero a un libro de texto para un estudiante principiante en la universidad.

Soy un desarrollador de fuerza bruta, ¿cómo puedo mejorar mis habilidades de algoritmos?