Visión por computadora: ¿cómo se asignan / extraen los atributos de las imágenes?

Una de las formas de etiquetar imágenes con atributos es entrenar a un conjunto de clasificadores para atributos visuales individuales cuya lista ha sido especificada manualmente. [El enfoque de Su y Jurie

https://jurie.users.greyc.fr/pap…

En su trabajo, se presentan seis grupos de atributos semánticos para cubrir el espectro de (1) escenas globales (por ejemplo, estación de tren, dormitorio), (2) elementos de la escena local (por ejemplo, cielo, árbol), (3) color (por ejemplo, verde, rojo), (4) forma (p. ej. caja, cilindro), (5) material (p. ej. cuero, madera) y (6) objeto (p. ej.
cara, moto). Hace un total de 110 atributos diferentes.

Esto es similar a la idea presentada por Li et al. en su documento del Banco de Objetos, en
que una imagen se representa como las salidas localizadas de
detectores de objetos. En estos métodos, los clasificadores están entrenados para
cada atributo semántico individual y las salidas del clasificador
se usan para representar imágenes.
Banco de objetos

Existen diferentes enfoques y el primero, por supuesto, de los anotadores para etiquetar las imágenes. Otra forma es utilizar algún tipo de método sin supervisión para capturar los attirbutes de manera abstracta. O de nuevo obtenga un conjunto de datos para cada atributo. Entrene a los clasificadores para cada atributo que clasifique nuevas imágenes nuevas para asignar atributos que tengan cierta confianza en la imagen