Este es un problema interesante.
Hay muchas ideas y algoritmos para los vecinos más cercanos en grandes dimensiones, la mayoría de las veces si tiene muchos datos desea un algoritmo de aproximación para NN. Una posible solución es usar LSH (hashing sensible a la localidad) junto con la distancia de Hamming, esto puede ser muy rápido y hay muchas formas de ajustarlo, esto funciona bien en general cuando desea encontrar vectores que sean similares a otros, pero usted No son muy estrictos acerca de la similitud.
Existen otros enfoques para aproximar el problema, algunos construyen un gráfico, otros usan K-medias para comparar primero con k centroides y luego con los puntos asociados con los n centroides más cercanos, etc.
- ¿Qué algoritmo de búsqueda usan los sitios de matrimonio en línea en India?
- Cómo construir robots enjambre
- ¿Cómo explicaría los algoritmos gráficos en términos simples?
- ¿Hay algún uso de algoritmos que se usan en la programación en robótica?
- ¿Qué son los algoritmos? ¿Cómo trabajan?
Si tomamos una vista desde fuera del problema de los vecinos más cercanos si sus datos son como los describe, creo que las máquinas de factorización pueden ser un algoritmo a considerar. En este caso, el algoritmo “aprenderá” las características para cada usuario en su problema y la similitud entre los usuarios será un producto interno entre estos vectores aprendidos, es posible que pueda usar FM para resolver su problema sin siquiera calcular similitudes.