¿Cuál es el mejor algoritmo de agrupamiento adaptativo k-means (que k se elige automáticamente)?

Como señaló Amir, no hay nada llamado método “Mejor”, ya que es bastante subjetivo. Depende del problema comercial y la viabilidad técnica. Desde el punto de vista de la implementación, esta es la solución.

Estas son las medidas que se pueden usar para evaluar la K óptima para la agrupación de KMeans:

Método de codo: considere medidas como la distancia intragrupo, la relación de la distancia intra e inter clúster, y desarrolle un mecanismo para determinar el primer punto de inflexión: el punto codo (depende del usuario, puede ser el último en caso de que se prefieran más grupos)
Puntaje de Silhoutte: Obtenga puntajes de Silhoutte en R o Python y siga el paso para encontrar el punto óptimo.
Suma de la distancia al cuadrado: Python KMeans tiene un atributo llamado inercia_ que proporciona esta medida.
Calcule los criterios de información baysianos y encuentre un K algorítmico-aliado óptimo como se señaló en el paso 1.

Espero que esto ayude.

¿Cuál es la mejor clase de Machine Learning en Penn?

¿Cómo construye Apple su red neuronal para el nuevo iPhone X Face ID? Los usuarios solo registran sus caras una vez cuando configuran el teléfono inicialmente, entonces, ¿cómo podría esa foto de los usuarios ser un conjunto de entrenamiento lo suficientemente grande como para entrenar la red neuronal?

Cómo crear mi propia biblioteca de tokenizadores en PNL

¿Cuál es la diferencia entre Hadoop y Teradata aster?

¿Cuáles son algunos comandos básicos que dice un robot?

¿Cómo pueden los hackers hackear tu computadora?

Como en cualquier problema en el análisis de datos, no existe un método “mejor”, depende de los datos y de su objetivo. Existen métodos para k-means cuya solución considera tanto la calidad de la agrupación como la cantidad de agrupaciones.

¿Qué es lo que quieres lograr con tu agrupación?

Srinivas Rao

Es muy difícil proporcionar una respuesta porque la mejor respuesta es “depende”, ¡pero todos sabemos que no es una respuesta en absoluto!

Con muy poca información sobre el problema, diría que mi intuición tiende a dividir K-means como la respuesta a su problema. Es una variante de K-Means y no necesita especificar “k” como en K-means normal, pero debe decidir cuándo dejar de bisecar, en otras palabras, debe especificar qué es un buen grupo y qué es No es un buen grupo. Los grupos que no son buenos se dividirán en dos grupos y los grupos que ya son buenos se mantendrán, este proceso se repite hasta que todos los grupos sean buenos.

Srinivas Rao

More Interesting

¿Cómo está estudiando Conner Davis el aprendizaje automático?

¿Hay escasez de científicos de datos?

¿Cómo debe prepararse para un programa de maestría / doctorado centrado en la inteligencia artificial?

¿Qué es un proceso gaussiano?

Quiero aprender Python para el análisis de datos y el aprendizaje automático. ¿De dónde debería comenzar?

¿Cuáles son los problemas de investigación abiertos en el aprendizaje automático para la detección de intrusos?

¿Cuáles son algunos buenos proyectos de aprendizaje automático que implican el uso de estructuras de datos y tienen aplicaciones de la vida real y se pueden hacer en 2-3 semanas?

¿Cómo se puede imputar valores perdidos en SAS?

Cómo predecir cuándo ocurrirá el próximo evento (tiempo) usando variables cuantitativas independientes

Con el desarrollo de marcos informáticos escalables como TensorFlow y Spark, ¿seguirán siendo relevantes los marcos de una sola máquina? NumPy podría ser solo API.