¿Por qué una elección de K es mejor que otras en el algoritmo K-means?

El valor de ‘K’ en los algoritmos K-means no es más que una conjetura sobre el número natural de grupos o grupos presentes en un conjunto de datos. Imagínese, tiene una información que contiene muestras de frutas y animales. En este caso, si elige K = 2, debería obtener el mejor resultado de agrupación porque este es el número real de agrupaciones naturales en los datos. A medida que aumenta el número de grupos, intenta encontrar más agrupaciones dentro de estos animales y frutas. Esto puede degenerar sus resultados de agrupación porque se está alejando del número real de agrupaciones en estos datos. Sin embargo, si tiene algunas muestras de un grupo (como se muestra a continuación) → puede ser K = 3 es una mejor opción.

(Fuente – Fruit Art)

Del mismo modo, si tiene muestras de 3 grupos, por ejemplo, frutas, animales y humanos, entonces K = 3 es la elección correcta. K = 2 creará menos grupos de los deseados; por lo tanto, muchas muestras irán a grupos equivocados (por ejemplo, muchos humanos pueden ir a animales). K = 4 creará más grupos de los que realmente está presente en los datos y puede terminar teniendo múltiples grupos o grupos para una categoría específica.

Related Content

¿Son SHA256 y AES256 funciones hash o cifrados o algoritmos?

No tengo ningún talento en estructuras de datos y algoritmos, ¿debería abandonar mi título de CS?

Se da una matriz (n). La matriz puede atravesarse por saltos de tamaño <= k. Si en el índice i, un salto puede aterrizar en cualquier lugar desde i + 1 hasta i + k index.

¿Qué idioma debo aprender para el comercio de algoritmos?

¿Qué algoritmos necesito aprender para resolver al menos 5 problemas en los concursos de CodeChef Long?

Cómo construir robots enjambre

¿Cuáles son los diferentes factores involucrados en el análisis del algoritmo?

Supongo que ejecuta K-Means varias veces para cada valor de k para minimizar el efecto de una mala inicialización del centroide.

Estoy leyendo en su pregunta que evalúa los resultados de K-Means en función de “instancias asignadas incorrectamente”, por lo que supongo que tiene algún tipo de verdad básica sobre sus grupos.

Entonces la explicación es muy simple: el valor óptimo para k es el número de grupos que tiene en su verdad básica, por ejemplo, si tiene seis elementos y sabe que A va con B, C con D y E con F, entonces el k óptimo será 3, con un valor más bajo se verá obligado a juntar elementos que no están relacionados y con una k más alta se verá obligado a dividir elementos que deberían ir en el mismo grupo.

Luis Argerich

More Interesting

¿Un montón necesita usar una cola prioritaria?

¿Qué razones hay para aprender sobre algoritmos informáticos si no eres un informático?

Cómo encontrar un algoritmo eficiente para un problema

¿Qué papel juega la comprensión de los algoritmos y las estructuras de datos en la construcción de proyectos, conseguir un trabajo y hacer su trabajo?

Hay dos imágenes ¿Hay algún algoritmo que pueda decirnos si una imagen se recorta de la otra?

¿Cuál es un ejemplo de un algoritmo de filtro en la selección de funciones en el aprendizaje automático?

¿La lista vinculada es una estructura de datos estática o una estructura de datos dinámica?

¿Qué tan difícil sería para un novato la 'Introducción a los algoritmos' de Thomas H. Cormen?

¿Cómo es inventar tu propio algoritmo?

Si está utilizando Java durante las entrevistas algorítmicas, ¿puede omitir las clases de escritura y acceder directamente a los métodos?

¿Cuáles son los algoritmos utilizados por Google para SEO?

¿Cómo debería resolver mejor los problemas de programación?

¿Existe un algoritmo más rápido que O (kn ^ 2) para calcular las rutas más cortas k-step de una sola fuente en un gráfico ponderado?

¿Qué te dirías a ti mismo cuando recién comenzaste a programar, aprender algoritmos?

¿Cuáles son algunos de los algoritmos de aprendizaje automático sin supervisión utilizados para la detección de spam?

Web Analytics