¿Es posible codificar un algoritmo de manera que cuando se proporciona una imagen de entrada y la ropa que una persona usa en la imagen se recorta y compara con una imagen en una base de datos y sale con la coincidencia exacta / coincidencia más cercana?

No sé demasiado sobre los documentos o algoritmos que hacen esto. El único artículo que conozco es del grupo de Tamara Berg en Stony Brook, Nueva York:
http://tamaraberg.com/papers/par…
Consideran la tarea de analizar la ropa que usan las personas en una fotografía y recuperar imágenes de una base de datos que contiene prendas similares. Afirman ser capaces de manejar variaciones en la postura, etc., así que creo que este documento es exactamente lo que está buscando.

Su algoritmo en un nivel alto es simple: segmente la imagen en regiones (un problema resuelto), calcule la pose de la persona (no resuelto, pero existen algoritmos utilizables), use la pose y la segmentación para obtener las diferentes prendas. la persona está usando (por ejemplo, camisa, pantalones cortos, etc.) y recupera prendas similares del conjunto de datos usando color.

Entonces, en principio, este algoritmo puede hacer lo que quieras (también tienen código disponible). En la práctica, la estimación de la postura es un problema difícil, y si varias personas se apiñan, puede confundirse. La eficacia real del algoritmo es algo que tendrá que probar y verificar.

Es posible que desee leer esta respuesta del fundador de Plink

¿Cómo reconoce Plink Art las pinturas?

Su pregunta es muy similar, si no exacta. Hay muchas publicaciones y mucha investigación sobre este tema, busque Recuperación de imagen basada en contenido (CBIR).

HTH

Hay dos preguntas que trataría aquí.

1. ¿Es posible codificar un algoritmo de modo que pueda obtener la ropa que lleva una persona?

Sí. Existe una extensa investigación sobre el cultivo de formas irregulares e indefinidas ya realizadas. Utilizan los métodos de contorneado activo y segmentación de corte gráfico. En el primero, generalmente se optimiza una función de energía para obtener el contorno del objeto. En la segmentación de corte de gráfico, divide su imagen en grupos de K y realiza el algoritmo de corte de gráfico desde allí para segmentar su imagen.

2. ¿Puede hacerlo en múltiples imágenes, para obtener una segmentación múltiple, sí.

No entendí el concepto sobre la variación en las dimensiones.

Si sigues estos documentos y sus referencias, deberías poder entender cómo funciona la idea.

================================================== ========
http://www.tc.umn.edu/~baixx015/

http://pdf.aminer.org/000/292/85