¿Cuál es la diferencia entre la anotación automática de imágenes y la recuperación de imágenes?

Anotación de imagen:

  • Se trata de asignar una etiqueta a una imagen que está en forma de etiquetado de palabras clave o una descripción muy corta de la imagen.
  • Las etiquetas de un sistema de anotación de imágenes se pueden usar en un motor de búsqueda para recuperar imágenes. Por lo tanto, la anotación automática de imágenes se puede utilizar para ayudar a simplificar el problema de recuperación de imágenes. El motor de búsqueda puede hacer coincidir las etiquetas para encontrar imágenes coincidentes a gran escala.
  • La anotación automática de imágenes se puede convertir en un problema de clasificación a gran escala por el cual las etiquetas de clase abarcan el tamaño del vocabulario de las etiquetas o palabras clave.

Recuperación de imagen

  • Se trata específicamente de la recuperación. Dada una imagen de consulta x, nos encantaría encontrar todas las imágenes coincidentes en una gran base de datos de imágenes.
  • Como se indicó anteriormente, la anotación de imagen puede ayudar con la recuperación de imágenes a gran escala al etiquetar todas las imágenes de la base de datos con etiquetas o palabras clave y luego usar esas etiquetas para indexar las imágenes en una estructura de datos de búsqueda a gran escala. Las imágenes coincidentes se pueden clasificar según la cercanía de las etiquetas. Aunque esto puede no ser muy descriptivo porque las búsquedas estarán limitadas por la riqueza de las etiquetas.
  • Por lo tanto, el mejor enfoque es usar solo las características visuales como una bolsa de palabras en forma de características agrupadas utilizando la agrupación de k-means en un conjunto de características muy grande obtenido de una gran cantidad de imágenes. Esas características se pueden usar para buscar imágenes coincidentes de varias maneras utilizando el enfoque tf-idf (frecuencia de texto de frecuencia inversa de documento) en las palabras visuales. Luego, otros métodos de clasificación implicarían considerar la disposición geométrica de las características. También vale la pena señalar que las características se pueden obtener de una capa convolucional de alto nivel.

Por lo tanto, la anotación automática de imágenes y la recuperación de imágenes son dos cosas diferentes. La anotación de imagen es similar a la forma en que las personas etiquetarían una imagen que contiene un perro con una etiqueta de perro y la recuperación de imágenes se refiere a devolver un conjunto de imágenes coincidentes.

Espero que esto ayude.

More Interesting

¿Cuál es la relación de la función objetivo de muestreo negativo con la función objetivo original en word2vec?

¿Qué debo hacer para poder contribuir al campo de la visión por computadora y trabajar en Google en el futuro?

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?

En el muestreo de importancia, ¿cuál es la diferencia entre [matemáticas] p (x) [/ matemáticas] y [matemáticas] q (x) [/ matemáticas]?

¿Cuál es la diferencia entre un modelo paramétrico y un modelo no paramétrico?

¿Cuáles son algunas aplicaciones potenciales del seguimiento de objetos depredadores (nuevo algoritmo)?

¿Dónde estará (o podría) estar el Aprendizaje Profundo si la Ley de Moore continúa por otros 10-20 años?

¿Por qué las tasas de aceptación de las conferencias de minería de datos son tan bajas y qué tipo de documentos se rechazan?

¿Es posible agregar una nueva entrada a la capa totalmente conectada justo antes del softmax en la CNN?

¿Puedo controlar las señales neuronales desde un lugar?

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

En una máquina de vectores de soporte, el número de vectores de soporte puede ser mucho menor que el conjunto de entrenamiento. ¿Cómo puede ser útil esta característica?

¿Cuáles son los buenos libros para el aprendizaje automático?

¿Qué distingue una capa de una red neuronal de otras capas?

¿Cuáles son las falacias comunes de minería de datos?