http://en.wikipedia.org/wiki/Km…:
El algoritmo k-means tiene al menos dos deficiencias teóricas principales:
- Primero, se ha demostrado que el peor tiempo de ejecución del algoritmo es superpolinomial en el tamaño de entrada. (Arthur, D. y Vassilvitskii, S. (2006), “¿Cuán lento es el método k-means?”, Actas del vigésimo segundo simposio anual sobre geometría computacional, págs. 144-153)
- En segundo lugar, la aproximación encontrada puede ser arbitrariamente mala con respecto a la función objetivo en comparación con la agrupación óptima.
http://www.croce.ggf.br/dados/K%…:
- ¿Qué puedo hacer si soy un experto en aprendizaje automático supervisado?
- ¿Cuáles son los beneficios de usar el Descenso de gradiente de mini lotes?
- ¿Qué tipo de sistema de recomendación usar con datos extremadamente escasos?
- ¿Qué tipos de algoritmos de aprendizaje automático se utilizan para resolver algunos problemas populares del mundo real?
- ¿Es una idea loca aprender el aprendizaje automático y el aprendizaje profundo sin ningún conocimiento avanzado de matemáticas?
Similar a otro algoritmo, el agrupamiento K-mean tiene muchas debilidades:
- Cuando los números de datos no son tantos, la agrupación inicial determinará el clúster significativamente.
- El número de clúster, K, debe determinarse de antemano.
- Nunca conocemos el clúster real, utilizando los mismos datos, si se ingresa de una manera diferente puede producir un clúster diferente si el número de datos es pequeño.
- Nunca sabemos qué atributo contribuye más al proceso de agrupación, ya que suponemos que cada atributo tiene el mismo peso.
Una forma de superar esas debilidades es usar la agrupación K-mean solo si hay muchos datos disponibles.