La respuesta de Simba ya elabora con gran detalle los pasos que debe seguir, por lo que no voy a repetir todos sus puntos aquí.
Sin embargo, calificaré eso cuando se trata de la agrupación de k-means , saber el número adecuado de agrupaciones (k) es un factor muy importante a la hora de implementar este algoritmo, y debe tener un buen mecanismo en lo que respecta a computación k.
Una forma de hacerlo es mediante el uso del método de suma de cuadrados (wss) dentro de los grupos . Esencialmente, este método calculará la suma de cuadrados dentro de los grupos para cada grupo, y un diagrama de pantalla identificará gráficamente el punto en el que se minimiza el wss, lo que indica el número ideal de grupos:
- ¿Podemos usar variador automático para aprender una representación como el autoencoder de vainilla?
- ¿Qué significa decir que dos clasificadores son independientes?
- ¿Cómo es ser ingeniero de aprendizaje automático en Quora?
- ¿Es la reducción de dimensionalidad igual que la selección de características? ¿Cómo hacer la selección de características usando PCA en R?
- ¿Cuál es la diferencia entre la clasificación de vectores de soporte y la regresión? ¿Un regresor de vectores de soporte se comporta como una red neuronal por casualidad?
Puede encontrar los siguientes enlaces útiles para investigar más sobre cómo se puede implementar esto utilizando el software R:
¿Qué es “Dentro de la suma de cuadrados por conglomerado” en K-significa
kmeans y wss: encontrar el número óptimo de clústeres (k) | Michael Grogan
K-significa Clustering (de “R en acción”)