El valor de ‘K’ en los algoritmos K-means no es más que una conjetura sobre el número natural de grupos o grupos presentes en un conjunto de datos. Imagínese, tiene una información que contiene muestras de frutas y animales. En este caso, si elige K = 2, debería obtener el mejor resultado de agrupación porque este es el número real de agrupaciones naturales en los datos. A medida que aumenta el número de grupos, intenta encontrar más agrupaciones dentro de estos animales y frutas. Esto puede degenerar sus resultados de agrupación porque se está alejando del número real de agrupaciones en estos datos. Sin embargo, si tiene algunas muestras de un grupo (como se muestra a continuación) → puede ser K = 3 es una mejor opción.
(Fuente – Fruit Art)
- Cómo demostrar que la mochila continua con elementos de opción múltiple es un problema NP-difícil
- Si la compresión sin pérdida es completamente reversible, ¿por qué no omitimos un paso y solo usamos los archivos en su estado comprimido?
- ¿Cuáles son las aplicaciones de la vida real de los algoritmos?
- ¿Cuáles son los mejores algoritmos de aprendizaje sin supervisión para la corrección de errores tipográficos?
- ¿Qué es un algoritmo de colonia de abejas artificiales y cómo se puede utilizar para la optimización de estructuras de celosía?
Del mismo modo, si tiene muestras de 3 grupos, por ejemplo, frutas, animales y humanos, entonces K = 3 es la elección correcta. K = 2 creará menos grupos de los deseados; por lo tanto, muchas muestras irán a grupos equivocados (por ejemplo, muchos humanos pueden ir a animales). K = 4 creará más grupos de los que realmente está presente en los datos y puede terminar teniendo múltiples grupos o grupos para una categoría específica.