Una de las formas de etiquetar imágenes con atributos es entrenar a un conjunto de clasificadores para atributos visuales individuales cuya lista ha sido especificada manualmente. [El enfoque de Su y Jurie
https://jurie.users.greyc.fr/pap…
En su trabajo, se presentan seis grupos de atributos semánticos para cubrir el espectro de (1) escenas globales (por ejemplo, estación de tren, dormitorio), (2) elementos de la escena local (por ejemplo, cielo, árbol), (3) color (por ejemplo, verde, rojo), (4) forma (p. ej. caja, cilindro), (5) material (p. ej. cuero, madera) y (6) objeto (p. ej.
cara, moto). Hace un total de 110 atributos diferentes.
- ¿Debo dominar las matemáticas / IA para comenzar a trabajar en un proyecto de reconocimiento facial?
- ¿Podrían los extraterrestres ser máquinas de producción propia ya que máquinas altamente inteligentes habían eliminado a los productores originales?
- ¿Qué lenguaje de programación debería aprender para la IA que será predominante en el futuro cercano?
- Si soy nuevo en programación y quiero aprender sobre programación de IA, ¿por dónde debo comenzar?
- ¿Qué es una buena tesis de grado superior relacionada con el riesgo de IA?
Esto es similar a la idea presentada por Li et al. en su documento del Banco de Objetos, en
que una imagen se representa como las salidas localizadas de
detectores de objetos. En estos métodos, los clasificadores están entrenados para
cada atributo semántico individual y las salidas del clasificador
se usan para representar imágenes.
Banco de objetos