¿Qué otros algoritmos / métodos se pueden usar como alternativa al algoritmo vecino más cercano para la medición de distancia y cuál funciona mejor que NN?

Pregunta actual: ¿Qué otros algoritmos / métodos se pueden usar como alternativa al algoritmo de vecinos más cercanos para la medición de distancia y cuál funciona mejor que NN?

(K) Los vecinos más cercanos no son una forma de medir la distancia, es una consulta contra un conjunto de datos representados como puntos. Los cálculos de distancia se utilizan para calcular los (k) vecinos más cercanos a un punto de consulta, suponiendo que los vecinos más cercanos exactos son lo que se solicita. Esto puede ser muy ineficiente, ya que requiere un cálculo de distancia para cada punto.

Sospecho que la pregunta que quiere hacer es algo como lo siguiente:

¿Qué otros algoritmos / métodos se pueden usar como alternativa al algoritmo de vecinos más cercanos, que evitan los cálculos de distancia explícitos y cuáles funcionan mejor que NN?

En este caso, hay varias opciones, y en su mayoría utilizan algún tipo de estructura de datos para realizar consultas. Algunos ejemplos de estructuras de datos son árboles kd, árboles de puntos de vista y árboles de bolas. Los tres hacen que se reduzca el número de cálculos explícitos de distancia utilizados por una consulta. Todos estos espacios comerciales por tiempo. La idea es podar grandes porciones de la base de datos para que no sea necesario buscarlas, pero esto requiere que guarden información adicional en la memoria.

También hay esquemas de hash, como el hash sensible a la localidad (LSH), en el que dos puntos se combinan en el mismo grupo si están muy juntos. Estos esquemas tienen el inconveniente de que, si bien son más rápidos, simplemente devuelven aproximaciones al conjunto de (k) vecinos más cercanos, porque los puntos se transforman (esencialmente) en un espacio diferente que es menos complejo.

Mira la respuesta de Bharat sobre esto:

¿Qué es un árbol kd y para qué se utiliza?

Los árboles KD son una de las técnicas más estándar para las búsquedas de vecinos que no son O (n ^ 2).