Cómo garantizar que la función SIFT sea invariante en perspectiva

Potencialmente, podría hacer que el proceso de coincidencia de características SIFT sea invariable en perspectiva al entrenar a un clasificador apropiado. El clasificador podría ser entrenado en pares de descriptores con la etiqueta de la clase como “coincidente” o “no coincidente”. Los datos de entrenamiento (para pares de descriptores “coincidentes”) podrían generarse renderizando modelos CAD en 3D utilizando perturbaciones aleatorias en una proyección de perspectiva dada, y muestras de muestras (codificadas como descriptores SIFT) en las ubicaciones correspondientes en las representaciones. Con suerte, esto permitirá que el clasificador aprenda a generar la clase “coincidencia” cuando se alimenta con un par de descriptores que son variaciones de perspectiva entre sí y “no coincidencia” de lo contrario.

No he visto ningún documento que haga esto, por lo que podría ser un pequeño y agradable proyecto de investigación.

Hay ASIFT (Affine-SIFT): Affine-SIFT (ASIFT)
que los autores afirman manejar grandes variaciones de puntos de vista y mostrar
que su detección es mejor que la tradicional SIFT.

More Interesting

¿Cómo debo prepararme para Shogun Machine Learning Toolbox en GSoC? ¿Es difícil ser seleccionado en Shogun?

Intuitivamente, ¿cómo funcionan los multiplicadores de Lagrange en SVM?

¿Cuál es la mejor manera de manejar un modelo multitarea si las etiquetas de datos de capacitación tienen NA, es decir, no se analizaron todas las muestras para todas las tareas?

ANNs: ¿Cómo usan las redes convolucionales el 'compartir peso'?

Cómo construir sobre modelos de red profunda de detección de objetos pre-entrenados (YOLO) para detectar nuevas clases

¿Qué es el modelo log-lineal latente con variables latentes y cómo se entrena tal modelo?

¿Cuáles son las historias de éxito del aprendizaje profundo para el procesamiento del lenguaje natural y los marcos y bibliotecas utilizados o creados por ellos?

¿Se puede usar tensorflow en SVM?

¿Qué hará Keras con TensorFlow-Slim?

Cómo entrenar una red neuronal para detectar un objeto en un video que no estaba presente en el cuadro anterior

¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

Cómo optimizar la clasificación de varias clases si ya conozco el número de ocurrencias de cada clase en el conjunto de datos de prueba

¿Cuáles son las principales diferencias entre la regresión logística, la red neuronal y las SVM?

¿Las redes de cápsulas reemplazarán a las redes neuronales?

¿Cuáles son los diferentes métodos de reducción de dimensionalidad en estadística?