¿Por qué la similitud de un coseno menos es igual a la distancia del coseno?

En primer lugar, la similitud de coseno entre dos vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] se define como:

[matemáticas] sim (a, b) = cos (\ theta) [/ matemáticas]

donde [math] \ theta [/ math] es el ángulo entre [math] a [/ math] y [math] b [/ math].

Pensemos geométricamente:

  • Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] comparten la misma dirección, entonces [matemática] \ theta = 0 [/ matemática] y [matemática] sim (a, b) = cos (0 ) = 1 [/ matemáticas].
  • Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] son ​​ortogonales, entonces [matemática] \ theta = \ frac {\ pi} {2} [/ matemática] y [matemática] sim (a, b) = cos (\ frac {\ pi} {2}) = 0 [/ math].
  • Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] son ​​opuestos, entonces [matemática] \ theta = \ pi [/ matemática] y [matemática] sim (a, b) = cos (\ pi ) = – 1 [/ matemáticas].

En general, si [math] \ theta [/ math] es el ángulo entre [math] a [/ math] y [math] b [/ math], entonces [math] sim (a, b) = cos (\ theta ) [/ math] es:

Por otro lado, la distancia del coseno mide la diferencia angular entre los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática]. Para lograr eso:

  • La función anterior se voltea sobre el eje x, porque queremos que los vectores similares estén cerca y los diferentes estén más lejos.
  • También se levanta una unidad, porque la distancia siempre debe ser positiva.

Es por eso que [math] dist (a, b) = 1 – cos (\ theta) = 1 – sim (a, b) [/ math].