¿Es posible generalizar el algoritmo K-Means para cualquier espacio métrico?

La distancia nunca es un problema, el problema es cómo calcular los centroides. Con la distancia euclidiana estándar, el promedio de todos los puntos funciona bien para el centroide de un grupo. También funciona bien para la distancia angular (similitud de coseno) que produce K-Means esféricos que funcionan bastante bien para texto e imágenes. Con otras métricas, el concepto de centroide se vuelve más complicado.

Como Justin dijo, K-Medoids es una extensión de K-Means para diferentes métricas y otra opción interesante es Kernel K-Means.

En Kernel K-Means, reemplaza el cálculo de distancias por el cálculo de un Kernel entre puntos. Lo curioso de Kernel K-Means es que los centroides nunca existen físicamente, solo necesita saber el grupo al que se asigna cada punto.

Kernel K-Means funciona bien cuando los datos no son lineales y son exactamente iguales a la agrupación espectral y mostrar que es una excelente manera de pasar tiempo en un viaje largo 😉

Análisis de conglomeradosCiencias de la computaciónMétricas

Related Content

¿El aprendizaje automático es una extrapolación de IA?

¿Cuáles son algunos ejemplos de fallas bizantinas en sistemas distribuidos?

¿Cómo realiza una unidad lógica aritmética (ALU) la multiplicación, suma y comparación en enteros sin signo muy grandes (8,000,000 bits o más)?

Cómo diseñar una máquina de Turing que acepte una cadena de longitud impar

¿Cuál es la magia detrás de los microchips? ¿Cómo pueden los impulsos eléctricos simples hacer tantas cosas? ¿Cuáles son los fundamentos detrás de esto?

¿Qué hace que la computadora funcione?

¿Cómo debe planificar un estudiante de CS su primer verano?

Sí. El algoritmo k-medoides es una de esas extensiones.

Justin Rising

More Interesting

¿Cómo hacen los softwares OBD-ll?

¿Qué posibilidades hay de obtener la admisión a buenas universidades como RWTH Aachen en Alemania con puntajes promedio de ingeniería?

No puedo elegir entre PHP / Codeigniter, Ruby / Rails y Python / Django para el desarrollo de un portal de trabajo en línea con mucho tráfico, ¿alguien puede sugerirme qué tecnología usar?

¿Cuál es la ventaja del modelo basado en reglas en comparación con el modelo basado en aprendizaje automático?

¿Cuál es la principal diferencia entre ATA y SATA?

¿Qué metodología / modelo de prueba crees que es más eficiente: gestión de prueba basada en sesión, modelos de contexto de texto o modelos de estrategia de prueba heurística?

¿Qué tan bueno es el programa de doble titulación CS en IIIT Hyderabad?

¿Cuáles son ejemplos de proyectos de aprendizaje automático donde la heurística se combina efectivamente con predicciones de modelos?

¿Cuáles son las aplicaciones del aprendizaje automático en las finanzas?

Soy gerente de producto no técnico en una empresa de tecnología empresarial. Teniendo en cuenta que la mayoría de los puestos de PM en estos días requieren algunas habilidades técnicas, quiero obtener una mejor comprensión de los roles que juegan los ingenieros de software en las empresas tecnológicas. ¿Dónde comenzaría uno? ¿Debo familiarizarme con lenguajes de programación específicos? ¿O centrarse más en el proceso de cómo se desarrolla el software?

¿Cuáles son algunos errores famosos en el mundo de la informática?

¿Qué porcentaje del trabajo de un ingeniero de almacenamiento es físico?

¿Qué es el algoritmo LWL (aprendizaje ponderado localmente) sobre el aprendizaje automático? ¿Me puede dar alguna información al respecto?

¿Es una mala decisión tomar electricidad incluso si puede obtener CS en BITS / IIT?

¿Mi licenciatura en ciencias de la computación de Carnegie Mellon Qatar será tratada al mismo nivel que la licenciatura en ciencias de la computación del campus de Pittsburgh?

Web Analytics