¿Es posible generalizar el algoritmo K-Means para cualquier espacio métrico?

La distancia nunca es un problema, el problema es cómo calcular los centroides. Con la distancia euclidiana estándar, el promedio de todos los puntos funciona bien para el centroide de un grupo. También funciona bien para la distancia angular (similitud de coseno) que produce K-Means esféricos que funcionan bastante bien para texto e imágenes. Con otras métricas, el concepto de centroide se vuelve más complicado.

Como Justin dijo, K-Medoids es una extensión de K-Means para diferentes métricas y otra opción interesante es Kernel K-Means.

En Kernel K-Means, reemplaza el cálculo de distancias por el cálculo de un Kernel entre puntos. Lo curioso de Kernel K-Means es que los centroides nunca existen físicamente, solo necesita saber el grupo al que se asigna cada punto.

Kernel K-Means funciona bien cuando los datos no son lineales y son exactamente iguales a la agrupación espectral y mostrar que es una excelente manera de pasar tiempo en un viaje largo 😉

Sí. El algoritmo k-medoides es una de esas extensiones.

More Interesting

¿Cómo hacen los softwares OBD-ll?

¿Qué posibilidades hay de obtener la admisión a buenas universidades como RWTH Aachen en Alemania con puntajes promedio de ingeniería?

No puedo elegir entre PHP / Codeigniter, Ruby / Rails y Python / Django para el desarrollo de un portal de trabajo en línea con mucho tráfico, ¿alguien puede sugerirme qué tecnología usar?

¿Cuál es la ventaja del modelo basado en reglas en comparación con el modelo basado en aprendizaje automático?

¿Cuál es la principal diferencia entre ATA y SATA?

¿Qué metodología / modelo de prueba crees que es más eficiente: gestión de prueba basada en sesión, modelos de contexto de texto o modelos de estrategia de prueba heurística?

¿Qué tan bueno es el programa de doble titulación CS en IIIT Hyderabad?

¿Cuáles son ejemplos de proyectos de aprendizaje automático donde la heurística se combina efectivamente con predicciones de modelos?

¿Cuáles son las aplicaciones del aprendizaje automático en las finanzas?

Soy gerente de producto no técnico en una empresa de tecnología empresarial. Teniendo en cuenta que la mayoría de los puestos de PM en estos días requieren algunas habilidades técnicas, quiero obtener una mejor comprensión de los roles que juegan los ingenieros de software en las empresas tecnológicas. ¿Dónde comenzaría uno? ¿Debo familiarizarme con lenguajes de programación específicos? ¿O centrarse más en el proceso de cómo se desarrolla el software?

¿Cuáles son algunos errores famosos en el mundo de la informática?

¿Qué porcentaje del trabajo de un ingeniero de almacenamiento es físico?

¿Qué es el algoritmo LWL (aprendizaje ponderado localmente) sobre el aprendizaje automático? ¿Me puede dar alguna información al respecto?

¿Es una mala decisión tomar electricidad incluso si puede obtener CS en BITS / IIT?

¿Mi licenciatura en ciencias de la computación de Carnegie Mellon Qatar será tratada al mismo nivel que la licenciatura en ciencias de la computación del campus de Pittsburgh?