¿Qué se necesita para aprender a construir una aplicación de reconocimiento de imágenes?

Construir un motor de búsqueda de imágenes no es una tarea fácil si quieres hacerlo profesionalmente o a gran escala.

Podemos dividir el proceso en estas partes:

Creación del algoritmo de extracción de características: las redes neuronales convolucionales (CNN) se utilizan principalmente para estas tareas, pero la construcción de la topología y el entrenamiento correctos con suficientes datos etiquetados puede ser la parte más difícil.
Preproceso: preprocesamiento de imágenes procedentes de la cámara para obtener la mejor precisión.
Indexación: después del preprocesamiento, debe extraer las funciones y guardarlas en un almacén de datos escalable y distribuido.
Búsqueda: se utilizan algunas métricas de distancia entre las características para calcular las puntuaciones de similitud de imagen. Si tiene millones de imágenes, debe usar técnicas de programación distribuida para manejarlo en segundos.

El uso de API de reconocimiento de imágenes de algunos proveedores también puede ser una buena alternativa.

https://www.linkedin.com/pulse/5…

Algoritmosaplicaciones móvilesAprendizaje automáticoReconocimiento de imágenesReconocimiento de patronesVisión por computadora

Redes Adversarias Generativas: ¿cuál es la intuición detrás del mapeo de una muestra de ruido aleatorio a una muestra de datos?

¿Quién es la estrella en ascenso de la IA fuera del aprendizaje profundo?

¿Cómo funciona el mecanismo de atención de múltiples cabezas en el aprendizaje profundo?

¿Cuáles son los mejores usos de Deep Learning para la clasificación de relevancia de búsqueda?

¿Debe una contraseña aleatoria de 64 caracteres no tener caracteres repetidos?

Cómo explicar intuitivamente los tensores

Me preocupa que la pregunta necesite más información para dar una respuesta más específica. De todos modos, intentaré mi parte basándose en mi comprensión de lo que quieres hacer, que es combinar imágenes digitalmente.

Normalmente comenzaría escribiendo pequeños programas para hacer coincidir los píxeles de dos copias de la misma imagen y luego procedería a agregar tolerancia para los valores de tono, luz y saturación. Una vez que tenga la comprensión básica de estos, puede elegir varios algoritmos de coincidencia de imágenes y ver cuál se adapta a sus necesidades.

Algunos de los recursos para involucrarte son
OpenCV
Resemble.js: análisis de imágenes
wihoho / Reconocimiento de imagen
Principios del procesamiento de imágenes digitales: técnicas fundamentales (Temas de pregrado en informática): Wilhelm Burger, Mark J. Burge: 9781848001909: Amazon.com: Libros

En algún momento, necesitará pensar en técnicas adaptativas y neuronales.
Teoría de resonancia adaptativa
Reconocimiento de imagen con redes neuronales

Utkan Menteş

Reconocimiento óptico de caracteres

Priyadarshi Kunal

More Interesting

¿Por qué es importante la eliminación de variables en los modelos gráficos probabilísticos?

¿El aprendizaje por refuerzo es meta-aprendizaje?

¿Qué es un buen algoritmo de recomendación de películas?

¿Necesita saber la teoría de la medida para hacer investigación de aprendizaje automático?

¿Cuál es la forma correcta de calcular la similitud de coseno entre una consulta y un documento? Cuando calculo la magnitud del documento, ¿sumo los cuadrados de todos los términos del documento o solo los de la consulta?

¿Qué papel juegan las redes neuronales y el aprendizaje automático en la atención médica?

¿Se pueden resolver todos los problemas de aprendizaje automático mediante redes neuronales?

¿Cuál es la diferencia entre embolsado y bootstrapping en ML / estadísticas?