Este problema está relacionado con el problema de identificación , donde tenemos una base de datos de características de imágenes y estamos consultando la imagen para encontrar la coincidencia más cercana.
Actualmente en caso de tal tarea, el aprendizaje profundo con aprendizaje métrico funciona mejor. El ejemplo de dicho algoritmo es [1703.07464v3] No Fuss Distance Metric Learning usando Proxies de Google. Están utilizando dicha metodología para buscar autos, productos, etc. similares. Entonces, supongo, ¡también funcionaría para pintar! También podría familiarizarse con la competencia de Kaggle https://www.kaggle.com/c/painter…, que estaba tratando de responder una pregunta: “¿Podemos clasificar la pintura por el estilo único del pintor?”
Ok, entonces, ¿qué es el aprendizaje métrico? Se trata de extraer las características significativas de las imágenes, que luego podrían compararse fácilmente con otras imágenes utilizando la distancia euclidiana o coseno. Hay tres formas principales de abordar el tema mientras se entrena el modelo:
- ¿Qué es una cola en la estructura de datos?
- Cómo clasificar 5 números, de mayor a menor, con sentencias if y no arrays en Java o Python
- En IA, ¿los datos son más importantes que los algoritmos?
- ¿Cuál es el curso / certificación mejor pagado disponible para estructuras de datos y algoritmo?
- ¿Cuáles son algunos buenos proyectos en el algoritmo de optimización de colonias de abejas en los que puedo trabajar como proyecto de mi último año?
- Usando una sola imagen e intentando hacer que las características de la misma clase sean similares
- Uso de pares de imágenes y aprendizaje de la tarea ‘Misma clase’ o ‘No misma clase’. Entonces estamos aprendiendo la tarea de verificación
- Usando Triplets, donde tenemos tres imágenes de la misma clase. (dos de la misma clase, uno del otro). Y queremos que los ejemplos de la misma clase estén más cerca (en el espacio de características) entre sí que con el tercer ejemplo. Esta es exactamente la tarea de identificación .
Hay muchos documentos al respecto, nombrando varios:
Un enfoque de aprendizaje de características discriminatorias para el reconocimiento facial profundo: individual
Aprender una métrica de similitud de forma discriminatoria, con aplicación para la verificación facial – Par
Una incrustación unificada para el reconocimiento facial y la agrupación – Tripletas
El uso de Deep Learning con Metric Learning no es un enfoque fácil, pero debería proporcionarle los mejores resultados. Recuerde que necesita una base de datos de capacitación para aprender un modelo, luego puede comenzar a usarlo.