¿Cuál es la diferencia entre Manhattan y las medidas de distancia euclidiana?

La diferencia depende de tus datos.

Para los vectores de alta dimensión, puede encontrar que Manhattan funciona mejor que la distancia euclidiana.

La razón de esto es bastante simple de explicar. Considere el caso donde usamos la norma [math] l_ \ infty [/ math] que es la distancia de Minkowski con exponente = infinito. Entonces la distancia es la mayor diferencia entre dos dimensiones de sus vectores. Podemos ver que esto no tiene sentido en muchas dimensiones, ya que estaríamos ignorando la mayor parte de la dimensionalidad y midiendo la distancia en función de un solo atributo.

Por lo tanto, reducir el exponente hace que las otras características jueguen un papel más importante en el cálculo de la distancia. Cuanto menor sea el exponente, menos relevante será una gran diferencia en alguna dimensión dada.

Algo interesante es que las distancias con exponente <1 podrían funcionar incluso mejor que Manhattan: [matemáticas] (|| xy || ^ p) ^ {1 / p} [/ matemáticas] con p <1. Curiosamente, estas distancias no son métricas válidas, ya que la desigualdad triangular no se cumple, pero se pueden usar de todos modos.

Gracias por la A2A
Luis.

En 2d, la distancia euclidiana mide la distancia más corta en el avión, la métrica de Manhattan es la ruta más corta si solo se le permite moverse horizontal o verticalmente. Por ejemplo, si a = (0,0) b = (3,4) entonces
dist_euclid (a, b) = sqrt (3 ^ 2 + 4 ^ 2) = 5
dist_manhattan (a, b) = 3 + 4 = 7

en n dimensiones y puntos a = (a1, …, an), b = (b1, … bn)
dist_euclid (a, b) = sqrt (a1 ^ 2 +… an ^ 2)
dist_manhattan (a, b) = suma (abs (a1-b1) +… + abs (an-bn))

Ambos miden las rutas más cortas, pero la métrica euclidiana no tiene ninguna restricción, mientras que la métrica de Manhattan solo permite rutas constantes en todas las dimensiones excepto en una

EDITAR: Escribí la respuesta medio dormido sin leer la segunda parte de tu pregunta.
Elegir la noción ‘correcta’ de distancia requiere comprender el contexto. Cuando viaja en avión, la distancia euclidiana suele ser la noción correcta (ignorando la curvatura de la tierra) para aproximar el tiempo de viaje mientras viaja en taxi en Manhattan, la métrica de Manhattan es una buena aproximación.
Entonces, la noción ‘correcta’ de distancia depende de qué es lo que desea medir.

Esto ya ha sido respondido aquí -> Euclidean vs Chebyshev vs Manhattan Distancia

Siga este enlace. Explica de manera breve y sencilla.

Euclidiana vs Chebyshev vs Manhattan Distancia

Gracias

Aquí hay una buena ilustración de la distancia Manhattan vs Eucliden:

En el 90% de los casos, usaría la distancia euclidiana porque es más intuitiva y es algo que todos entienden.

More Interesting

Cómo tomar una matriz 1d y convertir la matriz en una matriz 2d en una función c ++ para que la matriz ahora sea 2d en main ()

¿Cuál es la mejor manera de implementar una lista cerrada para un algoritmo de búsqueda en C?

¿Cuáles son algunos ejemplos del mundo real de máquinas simples?

¿Nuestro código genético utiliza algoritmos de compresión?

Si una computadora toma el control total del control del tráfico aéreo, ¿cómo será el algoritmo? ¿Cómo manejará los aterrizajes de emergencia y cómo manejará una pista paralela?

¿Cuál es la diferencia entre la mochila y los problemas de Cutting the Rod usando programación dinámica?

Cómo resolver el problema de invertir la cadena dada si el tamaño de la cadena es mayor que el tamaño de mi RAM

¿Por qué las matrices tienen una mejor ubicación de caché que la lista vinculada?

¿Por qué algún algoritmo tiene la misma salida?

¿Cuál es el algoritmo detrás de la agregación de noticias de Facebook News alrededor de una palabra clave en particular?

¿Qué debo usar para reducir los atributos en mi conjunto de datos, PCA o algoritmos de selección de características?

¿Por qué usar un diagrama de flujo es una mala práctica en la programación?

¿Puedo adoptar un enfoque de alto nivel para aprender Machine Learning sin molestar a los matemáticos detrás de los algoritmos de ML?

¿Cuál es la complejidad temporal del uso de un árbol de búsqueda binario para ordenar los números de un grupo?

Dado un problema, como un problema de diseño o un problema de algoritmos, ¿cómo resolverá un ingeniero de software experimentado ese problema?