Como persona sin entrenamiento formal real en visión artificial, pero que pasa básicamente toda su vida en ella, intentaré explicar los algoritmos de búsqueda basados en SIFT en términos técnicos básicos y luego con una analogía simple:
Proceso técnico
Queremos identificar de qué es una imagen
1) Identificar puntos clave, generalmente esquinas.
2) Construya un descriptor que describa el espacio alrededor del punto clave en una materia invariable (es decir, no importa cuánto acerque o aleje, gire, traduzca la imagen, permanece igual)
3) Haga coincidir los descriptores entre imágenes para descubrir de qué está tomando una foto.
Analogía
Queremos identificar a las personas en función de sus manos.
1) Identificar las yemas de los dedos
2) Mira las ranuras en tu piel alrededor de estas yemas de los dedos, las llamaremos “huellas digitales”
3) Consulte estas “huellas digitales” de una base de datos para averiguar a quién pertenecen.
- ¿Es necesario un MS o PhD en Machine Learning para trabajar en este campo en alguna empresa?
- OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?
- ¿Cómo está estudiando Conner Davis el aprendizaje automático?
- ¿Es realmente posible comenzar una carrera seria de IA / ML con el objetivo final de trabajar en un lugar como OpenAI, Google o DeepMind a través del autoestudio?
- ¿Cuál es la diferencia entre neurociencia, neurobiología, neuroingeniería y neuropsicología?
El “algoritmo” SIFT define específicamente cómo se construye el descriptor en (2) en las imágenes. La razón por la que es famosa es porque si lo piensas, es difícil encontrar un algoritmo que pueda reconocer un punto independientemente de su orientación / traducción / tamaño.
Como comentario: el documento original (http://www.cs.ubc.ca/~lowe/paper…) en realidad explica cómo hacer todos los pasos anteriores, pero el segundo paso es el que se usa continuamente ( ejemplo técnico: el uso del espacio de escala extrema para encontrar esquinas a menudo se reemplaza con la detección de esquinas FAST o la detección de esquinas harris