Visión por computadora: ¿Cuáles son algunos problemas de investigación abierta en la recuperación de imágenes basada en contenido?

Respuesta de la investigación: la recuperación de imágenes basada en contenido (CBIR) es un problema desafiante. Una vez que se logra una precisión de recuperación suficientemente aceptable, la comunidad a menudo empuja por un conjunto de datos abierto más grande (Holidays, Copydays, ImageNet (clasificación detallada, explicaremos más adelante), Tral Images y otros de Torralba). La lista se está haciendo más grande gracias a las anotaciones de los usuarios en Flickr.

La delgada línea entre la clasificación y el CBIR es borrosa y eventualmente desaparecerá. Oye, ¿qué es CBIR si no es la clasificación de etiquetas múltiples y las imágenes de extracción con etiquetas predichas de una base de datos? Finalmente ImageNet + wordNet ~ = CBIR. El enfoque ahora es generar una representación (oh, Dios mío, mis características son óptimas, etc.) que es única con una huella de memoria mínima (binarización, PQ, compresión, etc.) y aprovecha las anotaciones textuales de etiquetas múltiples.

Buenos temas para leer: Bolsa de entidades (características, palabras, jirafas). Vectores Fisher, codificación dispersa, cuantificación de productos, clasificación de grano fino (ImageNet). Métodos de hash para representaciones de imágenes.

More Interesting

¿Cuáles son algunas técnicas comunes para el aumento de datos de video en el aprendizaje profundo?

¿En qué áreas podría el aprendizaje automático ayudar a las personas a tomar decisiones imparciales?

¿Cuál es una buena definición de Generalización wrt Deep Learning?

¿Cómo empiezo a analizar una base de datos de análisis web?

¿Cuáles son los problemas de investigación en la detección de objetos?

¿En qué conjuntos de datos se formó el Sistema de traducción automática neuronal (GNMT) de Google?

Aprendizaje profundo: ¿Una versión suave de unidades lineales rectificadas funciona mejor o peor que una no lineal?

Andrew Ng: ¿Por qué ya no es necesario entrenar capas a través de codificadores automáticos para Deep Learning?

¿Cómo determina Quora a quién poner en mi sección "mejorar su alimentación"?

Cómo configurar datos de entrenamiento para una red neuronal para generar valores de joystick basados ​​en una entrada de imagen

¿Existe algún informe publicado que haya aplicado con éxito el aprendizaje profundo para un sistema de recomendación basado en contenido de texto?

¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?

¿Es un SVM o un clasificador MaxEnt apropiado para este escenario de clasificación de texto y por qué?

Cómo saber si, durante el entrenamiento de un modelo de aprendizaje profundo, está en camino de encontrar un mínimo local mejor o no

¿Cuáles son algunos modelos de detección de rostros basados ​​en aprendizaje profundo disponibles gratuitamente?