Los objetos de interés en una escena pueden aparecer a diferentes escalas, ubicaciones y rotaciones (tanto rotaciones internas como externas). Durante el emparejamiento, el primer paso normalmente es detectar los llamados puntos de interés en el espacio plano de la imagen 2D. Por lo tanto, las coordenadas de entidades indexadas se referencian con respecto al plano de imagen 2D, no al marco de referencia del objeto.
Con esto quiero decir que si un objeto sufre una traslación, escala o rotación, los puntos clave detectados seguirán su ejemplo. Es decir, los puntos clave son covariantes, no invariables para esas transformaciones. Para detectar de manera confiable el objeto, necesitamos procesar los puntos característicos con respecto al sistema de coordenadas del objeto. Si utiliza las coordenadas absolutas de la entidad, deberá buscar explícitamente el objeto en múltiples escalas, rotaciones, posiciones y otras transformaciones, esto no es eficiente.
¿Cómo podemos recuperar el sistema de coordenadas del objeto? La respuesta es lo que hace el hashing geométrico al elegir 2 o más pares de puntos característicos y usarlos como base para definir un sistema de coordenadas relativo. Ese nuevo sistema de coordenadas se vuelve verdaderamente invariable para las diversas transformaciones, por lo tanto, el objeto puede ser emparejado de manera confiable.
- ¿Cuáles son los mejores algoritmos de agrupamiento para puntos de datos numéricos multidimensionales?
- ¿Qué papel juega la comprensión de los algoritmos y las estructuras de datos en la construcción de proyectos, conseguir un trabajo y hacer su trabajo?
- ¿Qué tan preciso es el algoritmo de predicción de personalidad de Faception?
- ¿Cuál es la mejor manera de aprender estructuras de datos y cuáles son los libros para comprender esto fácilmente?
- ¿Hay alguna canción popular creada usando algoritmos / IA?
Si usa 2 pares de bases, solo puede generar invariancia a transformaciones 2D de similitud. Para construir tolerancia a la rotación fuera del plano también necesitará 3 pares de bases. Por lo tanto, cuantos más pares de bases usamos en el hashing geométrico, más invariables se vuelven los nuevos espacios de coordenadas a diversas transformaciones. Pero apuesto a que cuantos más pares de bases se elijan, más grande será el mapa hash, por lo que 3 pares de bases son normalmente un buen lugar.
Por lo tanto, los pares de bases múltiples ayudan a combinar objetos / imágenes similares independientemente de las transformaciones complejas que se aplican al objeto / imagen.
Espero que esto ayude.