Respuesta de la investigación: la recuperación de imágenes basada en contenido (CBIR) es un problema desafiante. Una vez que se logra una precisión de recuperación suficientemente aceptable, la comunidad a menudo empuja por un conjunto de datos abierto más grande (Holidays, Copydays, ImageNet (clasificación detallada, explicaremos más adelante), Tral Images y otros de Torralba). La lista se está haciendo más grande gracias a las anotaciones de los usuarios en Flickr.
La delgada línea entre la clasificación y el CBIR es borrosa y eventualmente desaparecerá. Oye, ¿qué es CBIR si no es la clasificación de etiquetas múltiples y las imágenes de extracción con etiquetas predichas de una base de datos? Finalmente ImageNet + wordNet ~ = CBIR. El enfoque ahora es generar una representación (oh, Dios mío, mis características son óptimas, etc.) que es única con una huella de memoria mínima (binarización, PQ, compresión, etc.) y aprovecha las anotaciones textuales de etiquetas múltiples.
Buenos temas para leer: Bolsa de entidades (características, palabras, jirafas). Vectores Fisher, codificación dispersa, cuantificación de productos, clasificación de grano fino (ImageNet). Métodos de hash para representaciones de imágenes.
- ¿Cuáles son algunos documentos de investigación de inicio sobre búsqueda, aprendizaje automático y recuperación de información?
- ¿Cuál es la diferencia entre Internet de las cosas y el aprendizaje automático y cuál debo aprender primero?
- ¿Cuáles son los algoritmos actuales de última generación para la detección de objetos en 2017?
- ¿El aprendizaje automático es un tema torpe?
- ¿Pueden Kmeans y el algoritmo DBSCAN dar el mismo resultado para un conjunto de datos en particular?