¿Por qué la similitud de un coseno menos es igual a la distancia del coseno?

En primer lugar, la similitud de coseno entre dos vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] se define como:

[matemáticas] sim (a, b) = cos (\ theta) [/ matemáticas]

donde [math] \ theta [/ math] es el ángulo entre [math] a [/ math] y [math] b [/ math].

¿Qué es el aprendizaje profundo para un principiante?
¿Cuál es la mejor base de datos para almacenar vectores de características de gran tamaño para su posterior recuperación y calcular las mediciones de distancia para la coincidencia de similitudes?
¿Hay algún lugar donde los métodos tradicionales de aprendizaje automático puedan vencer el aprendizaje profundo o las redes neuronales?
¿Qué opinas sobre la inteligencia artificial? ¿Vale la pena desarrollarla?
¿La variable de tiempo muestra una conexión recurrente en RNN?

Pensemos geométricamente:

Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] comparten la misma dirección, entonces [matemática] \ theta = 0 [/ matemática] y [matemática] sim (a, b) = cos (0 ) = 1 [/ matemáticas].
Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] son ortogonales, entonces [matemática] \ theta = \ frac {\ pi} {2} [/ matemática] y [matemática] sim (a, b) = cos (\ frac {\ pi} {2}) = 0 [/ math].
Si los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática] son opuestos, entonces [matemática] \ theta = \ pi [/ matemática] y [matemática] sim (a, b) = cos (\ pi ) = – 1 [/ matemáticas].

En general, si [math] \ theta [/ math] es el ángulo entre [math] a [/ math] y [math] b [/ math], entonces [math] sim (a, b) = cos (\ theta ) [/ math] es:

Por otro lado, la distancia del coseno mide la diferencia angular entre los vectores [matemática] a [/ matemática] y [matemática] b [/ matemática]. Para lograr eso:

La función anterior se voltea sobre el eje x, porque queremos que los vectores similares estén cerca y los diferentes estén más lejos.
También se levanta una unidad, porque la distancia siempre debe ser positiva.

Es por eso que [math] dist (a, b) = 1 – cos (\ theta) = 1 – sim (a, b) [/ math].

Machine Learning