¿Qué se necesita para aprender a construir una aplicación de reconocimiento de imágenes?

Construir un motor de búsqueda de imágenes no es una tarea fácil si quieres hacerlo profesionalmente o a gran escala.

Podemos dividir el proceso en estas partes:

  1. Creación del algoritmo de extracción de características: las redes neuronales convolucionales (CNN) se utilizan principalmente para estas tareas, pero la construcción de la topología y el entrenamiento correctos con suficientes datos etiquetados puede ser la parte más difícil.
  2. Preproceso: preprocesamiento de imágenes procedentes de la cámara para obtener la mejor precisión.
  3. Indexación: después del preprocesamiento, debe extraer las funciones y guardarlas en un almacén de datos escalable y distribuido.
  4. Búsqueda: se utilizan algunas métricas de distancia entre las características para calcular las puntuaciones de similitud de imagen. Si tiene millones de imágenes, debe usar técnicas de programación distribuida para manejarlo en segundos.

El uso de API de reconocimiento de imágenes de algunos proveedores también puede ser una buena alternativa.

https://www.linkedin.com/pulse/5…

Me preocupa que la pregunta necesite más información para dar una respuesta más específica. De todos modos, intentaré mi parte basándose en mi comprensión de lo que quieres hacer, que es combinar imágenes digitalmente.

Normalmente comenzaría escribiendo pequeños programas para hacer coincidir los píxeles de dos copias de la misma imagen y luego procedería a agregar tolerancia para los valores de tono, luz y saturación. Una vez que tenga la comprensión básica de estos, puede elegir varios algoritmos de coincidencia de imágenes y ver cuál se adapta a sus necesidades.


Algunos de los recursos para involucrarte son
OpenCV
Resemble.js: análisis de imágenes
wihoho / Reconocimiento de imagen
Principios del procesamiento de imágenes digitales: técnicas fundamentales (Temas de pregrado en informática): Wilhelm Burger, Mark J. Burge: 9781848001909: Amazon.com: Libros

En algún momento, necesitará pensar en técnicas adaptativas y neuronales.
Teoría de resonancia adaptativa
Reconocimiento de imagen con redes neuronales

Reconocimiento óptico de caracteres