¿Cuáles son las debilidades del algoritmo estándar k-means (también conocido como algoritmo de Lloyd)?

http://en.wikipedia.org/wiki/Km…:

El algoritmo k-means tiene al menos dos deficiencias teóricas principales:

  • Primero, se ha demostrado que el peor tiempo de ejecución del algoritmo es superpolinomial en el tamaño de entrada. (Arthur, D. y Vassilvitskii, S. (2006), “¿Cuán lento es el método k-means?”, Actas del vigésimo segundo simposio anual sobre geometría computacional, págs. 144-153)
  • En segundo lugar, la aproximación encontrada puede ser arbitrariamente mala con respecto a la función objetivo en comparación con la agrupación óptima.

http://www.croce.ggf.br/dados/K%…:

Similar a otro algoritmo, el agrupamiento K-mean tiene muchas debilidades:

  • Cuando los números de datos no son tantos, la agrupación inicial determinará el clúster significativamente.
  • El número de clúster, K, debe determinarse de antemano.
  • Nunca conocemos el clúster real, utilizando los mismos datos, si se ingresa de una manera diferente puede producir un clúster diferente si el número de datos es pequeño.
  • Nunca sabemos qué atributo contribuye más al proceso de agrupación, ya que suponemos que cada atributo tiene el mismo peso.

Una forma de superar esas debilidades es usar la agrupación K-mean solo si hay muchos datos disponibles.

Además de lo que Franck Dernoncourt mencionó, uno de los principales inconvenientes de la agrupación de K-means es la elección aleatoria de los centros de agrupación iniciales. Por qué es un problema? Porque, para cada ejecución diferente del algoritmo en el mismo conjunto de datos, puede elegir un conjunto diferente de centros iniciales. Esto puede conducir a diferentes particiones o resultados de agrupamiento en diferentes ejecuciones del algoritmo. Por lo tanto, es muy difícil repetir los resultados de la agrupación. Esto puede convertirse en un problema en los casos en que desee clústeres consistentes y confiables.

no es convexo, donde podría estar

Avances en NMF convexo: programación lineal

y debe ser

More Interesting

¿Existe un libro de aprendizaje automático que ofrece una guía paso a paso con números reales o ejemplos numéricos en algoritmos de aprendizaje automático?

¿Qué es incrustar | espacio incrustado | ¿Incorporación de características en arquitecturas neurales profundas?

¿Podemos usar variador automático para aprender una representación como el autoencoder de vainilla?

Cómo seleccionar efectivamente un tamaño de lote óptimo para la actualización de parámetros de aprendizaje profundo, basado en las especificaciones de GPU

¿Qué es un buen algoritmo de recomendación de películas?

¿Cuál es la mejor introducción al aprendizaje profundo para un estudiante graduado con experiencia en matemáticas y CS?

¿Cuáles son las preguntas más importantes en el aprendizaje automático?

La temperatura de la GPU lee 88 C cuando se entrena un LSTM en TensorFlow. ¿Es esto normal (y seguro)?

¿Puedo confiar en un modelo de clasificación con validación cruzada y precisión de prueba decentes incluso si el número de observaciones es menor que el de las características?

¿Cuáles son las consecuencias de usar la función de error del tren [matemáticas] \ min_ {f \ in \ mathcal {H}} \ max_ {i \ in \ {1… N \}} \ | f (x ^ {(i)}) - y ^ {(i)} \ | ^ 2 [/ math] en lugar del error de tren medio empírico estándar para Machine Learning?

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cómo se aplica la inteligencia artificial a los problemas ambientales?

Cómo gestionar y desarrollar un producto de big data

ANNs: ¿Cómo usan las redes convolucionales el 'compartir peso'?

¿Cuáles son los algoritmos actuales de última generación para la detección de objetos en 2017?