Primero, déjame definir qué es un clúster
Grupo: un grupo de cosas o personas similares posicionadas o que se producen muy juntas.
Entonces, la agrupación es-
- ¿Cuál es el mejor libro sobre estructuras de datos y algoritmos en Java?
- ¿Tengo que hacer programación competitiva si estoy aprendiendo la estructura de datos y los algoritmos, mientras que la programación competitiva me distrae o primero tengo que aprender la estructura de datos y el algoritmo por completo y luego saltar a la programación competitiva?
- ¿Cómo debo practicar para poder asear la mayoría de los concursos Gold de USACO?
- ¿Qué es una explicación intuitiva sobre cómo funcionan las matrices de sufijos?
- ¿En qué situaciones alguien usaría Dijkstra sin un montón sobre Dijkstra con un montón?
Agrupar cosas similares o puntos de datos más apropiados que pueden ser imágenes, videos, documentos de texto, etc.
El objetivo principal de todas las técnicas de agrupamiento es el mismo, es decir, formar grupos de cosas / puntos de datos similares.
y Así es el propósito de la agrupación k-means.
Tomar vectores de características como puntos de datos
Diferentes algoritmos de agrupación difieren en
- Criterios de convergencia (Cómo detenerse después de que se termine la agrupación)
- Cómo se asignan los puntos de datos a los clústeres.
- Medida de similitud (qué puntos de datos son similares)
Puede aplicar k-means a cualquier problema de agrupación siempre que tenga un vector de características adecuado (Modelo de espacio vectorial) desde puntos de datos y una medida de similitud / distancia que pueda medir similitud / distancia entre los vectores de características.
Para la aplicación práctica de clustering, piense en cualquier escenario en el que desee hacer grupos de cosas similares a partir de una colección de cosas distribuidas al azar.
Tomemos, por ejemplo, la agrupación de documentos
Tiene muchos documentos sobre diferentes temas (mitología, ciencia ficción, fantasía)
y desea formar grupos de documentos que pertenezcan al mismo tema / similar (según cómo extraiga las características de los documentos).
En este caso, la agrupación puede ayudar.
En la misma línea, piense que se aplica a un montón de imágenes y agrúpelas de manera similar.
Todo depende de cómo extraiga funciones de imágenes, videos, texto, otros
.
La función “similar” de la búsqueda web y la búsqueda de imágenes de Google funciona de la misma manera. (puede estar usando colecciones de otras técnicas también)