¿Qué es el hamming-incrustado? ¿Cómo mejora el modelo BoF?

Usando el modelo BoF, debe aplicar K-Means Clustering para ordenar las muchas palabras visuales que extrajo en las imágenes del conjunto de entrenamiento. Por lo general, el parámetro k, que identifica el número de centros del clúster, es bajo, porque el algoritmo gasta muchos recursos computacionales.

Con Hamming Embedded puede aumentar considerablemente el número de centroides para la cuantización de las palabras visuales, lo que permite una representación más precisa de las palabras visuales (¡se reduce el error de cuantización!).

Pasos de incrustación de Hamming:

1- subdividir las celdas asociadas a cada palabra visual en regiones (diagrama de Voronoi)

2- calcula una firma binaria para cada palabra visual

3- se produce una coincidencia de características cuando se asignan dos descriptores a la misma palabra visual y la distancia de Hamming entre las firmas binarias es menor o igual que un umbral.

Fuente:

  • Incrustación de Hamming y consistencia geométrica débil para la búsqueda de imágenes a gran escala (https://lear.inrialpes.fr/pubs/2…)
  • Sobre la explosión de elementos visuales (https://lear.inrialpes.fr/pubs/2…)

Una forma de hacer esto es convertir cada valor distinto de cero a 1 para que cada dimensión sea un indicador de esa característica en particular en lugar del recuento de ocurrencia. Entonces, esta representación proporciona implementaciones muy rápidas para la recuperación, clasificación, etc. Sin embargo, cuánto pierde del rendimiento siempre es una pregunta.

More Interesting

¿Cómo puede un adolescente publicar un trabajo de investigación?

¿Cuál es la mejor oportunidad de carrera para el ingeniero de investigación de visión por computadora (pregrado) en India?

¿Cuáles son algunos documentos que demuestran el uso de la teoría de la representación en informática?

¿Qué tan difícil es cambiar el área de investigación dentro de Informática después de obtener un doctorado?

¿Qué temas en algoritmos debería un estudiante con el objetivo de especializarse en la teoría de la complejidad computacional maestra?

¿Cuáles son las aplicaciones de las estadísticas en el campo de la informática?

¿Qué proyectos podría hacer en el paralelismo a nivel de hilo?

¿Qué tipo de problemas informáticos son más divertidos de resolver?

¿Cómo puedo investigar sobre la depresión cuando mi especialidad es la visión por computadora y el aprendizaje automático?

¿Cuáles son las pruebas más importantes que uno debe estudiar en el campo de la informática teórica?

¿Cómo debo prepararme si quiero investigar en aprendizaje automático? ¿Hay documentos particulares que debería leer o algoritmos que debería implementar?

¿Cuál es la diferencia entre estos documentos de Collobert y Weston: Una arquitectura unificada para PNL (2008) vs. Aprender PNL desde cero (2011)?

¿Cuál es un buen tema de investigación sobre informática sin servidor?

Siendo un estudiante universitario, ¿cómo puedo publicar gratuitamente trabajos de investigación en ciencias de la computación?

Cómo publicar una investigación de inteligencia artificial si actualmente no estoy en la academia o en un entorno de investigación de la industria