¿Cómo funciona LSH, ‘hashing local sensible’, para calcular el valor de hash?

Depende de la métrica que use para juzgar la similitud entre los datos. LSH intenta mezclar elementos similares al mismo cubo y la forma de hacerlo depende de lo que usemos como medida de similitud / distancia.

Si usa Jaccard como su medida de distancia / similitud, entonces LSH se puede construir a través de hashes mínimos. Si usa la distancia euclidiana, LSH se basa en proyecciones aleatorias.

Considere que usa la distancia euclidiana. Sus datos consisten en vectores en n dimensiones y su objetivo es hacer hash vectores que estén cerca del mismo cubo.

Por lo tanto, puede crear un vector aleatorio de n dimensiones y calcular el producto de punto entre ese vector aleatorio y sus datos. Los resultados son números reales, por lo que proyecta desde n dimensiones hasta una línea aleatoria. Entonces, si tienes b cubos, divides los números reales en intervalos b. Entonces la función hash es

H (x) = punto (r, x) / w

Donde r es un vector de proyección aleatorio yw es un parámetro.

Piensa ahora en 2d imagina que tus puntos están muy separados en la dimensión y pero área igual en x si tu proyección aleatoria es paralela a x, entonces la función dividirá los puntos en el mismo cubo. Para evitar falsos negativos y falsos positivos, debe utilizar no una sino varias funciones hash y tablas hash y luego combinar sus resultados.

Luis.

Related Content

Cómo resolver este problema: http://www.spoj.com/problems/RENT/

¿Hay algún tutorial de algoritmos y estructuras de datos donde aprendas a través de los juegos?

¿Cuáles son las partes fáciles de la informática y cuáles son las partes difíciles?

Si necesita almacenar operaciones de deshacer / rehacer en un procesador de textos, ¿qué estructura de datos se puede usar?

¿Cómo podemos verificar de forma recursiva si una lista vinculada individualmente es un palíndromo?

Cuando abro mi computadora portátil, muestra la pantalla ‘La aplicación Load MMdriver ha dejado de funcionar’ ¿qué puedo hacer para solucionar esto?

¿Existe un algoritmo para encontrar el día de cualquier fecha de cualquier año?

More Interesting

¿Cuáles son algunos algoritmos importantes que aún no están cubiertos en Mahout? ¿Qué algoritmos de ML le gustaría agregar a la caja de herramientas?

¿Qué es más importante, aprender múltiples lenguajes de programación o practicar algoritmos?

¿Cómo se implementa la estructura de datos establecida en C?

¿Cómo eliges un campo interesante en informática?

Cómo escribir una función recursiva usando Python que toma una cadena como entrada e imprime cada carácter en una línea separada

Quiero aprender la estructura de datos y Java, ¿cuál debería aprender primero?

¿Cuáles son las limitaciones de los árboles de búsqueda binarios?

Cómo eliminar duplicados en un vector C ++ y también si solo quiero elementos duplicados

¿Cómo se implementan las matrices de JavaScript internamente?

¿Cuál es el algoritmo de esta pregunta de Hacker-Rank?

¿Cuál es la diferencia entre un algoritmo y un procedimiento?

Cómo encontrar proyectos en algoritmo

¿Qué es importante saber y estudiar para ser un excelente programador? ¿Es importante practicar programación competitiva?

¿Cuál es la relación de recurrencia para el tipo de selección?

¿Hay algún uso de algoritmos que se usan en la programación en robótica?

Web Analytics