Desde mi limitado conocimiento, puedo sugerirle que use lo que se conoce como arquitectura siamesa. Los modelos de arquitectura siameses aprenden una representación de características latentes que agrupa imágenes similares donde usted define la similitud. En su caso, la similitud sería imágenes de la misma persona. Para otro caso, es posible que desee separar caras y casas en dos grupos, por lo que la similitud es la estructura de la cara en sí y la estructura de la casa. La misma idea se puede utilizar para la verificación de firma.
A continuación se muestra una representación de la arquitectura siamesa:
- ¿Cuáles son algunos de los documentos fundamentales sobre el aprendizaje profundo?
- ¿Cuál es el básico antes de aprender el aprendizaje automático?
- ¿Hay algún solucionador que minimice la función objetivo [matemática] f (x) = \ matemática {e} ^ x [/ matemática] donde [matemática] x> 0 [/ matemática]?
- ¿Es aconsejable crear una aplicación basada en el aprendizaje automático y el procesamiento de imágenes sin comprender el concepto matemático subyacente?
- Cómo modelar la siguiente situación probabilística
La similitud se encuentra usando esta representación oculta.
Aunque otras respuestas sugieren usar un modelo de aprendizaje profundo pre-entrenado y su vector de representación de espacio latente para encontrar una similitud, es posible que no obtenga la similitud que USTED desea. La representación del espacio latente es súper generalizada porque, a menudo, estos modelos se entrenan en el conjunto de datos ImageNet. Entonces la tarea es bastante diferente. Pero si realmente quieres aprovechar un modelo pre-entrenado, es muy simple convertir una red como VGG16 a una arquitectura siamesa.
Para implementar algo en estas líneas, puede llevarlo a cualquier lugar entre un par de días o un mes, dependiendo de su conjunto de datos, la infraestructura de aprendizaje profundo que tenga y su experiencia en el tema.
¡Espero que esto ayude!