Cómo crear mi propia función de hash para usar en una tabla de búsqueda

Aquí hay dos ideas de alto nivel.

Intenta encontrar una manera de asignar un objeto a un entero. Intente incorporar cada pequeña característica de ese objeto de modo que se obtenga un nuevo entero después de convertirlo. Que esto sea una función [matemáticas] f [/ matemáticas]
Asigne este entero a un entero más pequeño que tendrá una longitud [matemática] 0 [/ matemática] a [matemática] m – 1 [/ matemática] donde [matemática] m [/ matemática] es la longitud de la matriz que está utilizando como una tabla hash. Que esto sea una función [matemáticas] g [/ matemáticas].

Deje que [math] x [/ math] sea el objeto de entrada. Debe encontrar [math] f (g (x)) [/ math], que es solo un número en el rango [math] 0 \ leq x <m [/ math].

Por ejemplo, considere el método hashCode en java. Toma un objeto y escupe un número entero de 32 bits. Para un número entero, simplemente podría devolver su valor para una implementación de hashCode . Para un objeto más complicado, como una cadena, puede combinar los valores ascii de todos los caracteres en la cadena para producir un número grande y luego devolver ese número mod [math] 2 ^ {32} [/ math].

Finalmente, después de tener la función [math] f [/ math], necesitamos una función [math] g [/ math] que se asigne al rango [math] [0, m-1] [/ math]. El más simple es [matemáticas] g (x) = x \ pmod {m} [/ matemáticas]. Las funciones más elegantes se utilizan en la práctica.

¿Hay algún algoritmo que un principiante pueda adoptar para resolver un Cubo de Rubik a partir de cualquier configuración?

¿Qué tipos de problemas se pueden resolver usando algoritmos?

Como estudiante de primer año de una sucursal que no es CS en un IIT, ¿cómo domino las estructuras de datos, los algoritmos y el aprendizaje automático por mi cuenta?

Quiero usar una cola prioritaria en un problema. Creo que implementar una cola prioritaria usando una matriz es más fácil que usar un montón. ¿Qué piensas y por qué?

¿Cuál es el problema conmigo si puedo decir cómo funciona el algoritmo pero no puedo escribir el programa para el mismo? ¿Cómo puedo deshacerme de él? ¿Por favor ayuda?

¿Cuáles son los mejores sitios web corporativos?

No veo el beneficio, ya que la generación de hash son algoritmos bien dominados y hay poco que ganar en términos de diferenciación mediante el uso de la propia función.

Pero si el beneficio es para aprender o evitar el uso del código de otra persona, entonces podría ser válido. No debería ser difícil encontrar en Internet varios códigos fuente para las funciones hash que se pueden inspeccionar o convertir a su idioma de destino.

Una buena función hash distribuirá los códigos generados de manera más o menos homogénea dentro de un rango. Por lo tanto, incluso si la entrada se concentra principalmente en letras y / u otro subrango de caracteres, la salida se distribuirá uniformemente en todo el rango de resultados. Es importante evitar demasiadas colisiones en los códigos de salida (es decir, una distribución desigual) porque el hash es una clave; Si hay demasiadas colisiones, la parte del algoritmo que almacena / recupera valores generalmente será menos eficiente.

Una forma de evitar colisiones es hacer algunas operaciones de intercambio / bit en su entrada; o multiplique los bytes de entrada por algunos números primos muy grandes.

Cesar Gil

Una pregunta interesante

Una función hash decente debe tener dos atributos.