Utiliza una estructura de datos de cuadrícula de resolución múltiple para la agrupación.
Tipos:
1) STING (Apporach de cuadrícula de información estadística)
- ¿Cuál debería ser mi plan de estudio para convertirme en científico de datos?
- Cómo conseguir un trabajo en el campo del aprendizaje automático o la ciencia de datos en India si soy muy bueno en 3 lenguajes de programación y algoritmos
- ¿Cuál es el mejor extractor de datos web?
- ¿Qué tan difícil para un principiante de programación aprender tecnologías de ingeniería de datos?
- ¿Cuál es un mejor instituto para el análisis de datos y la ciencia de datos en la India?
2) Grupo de ondas
3) CLIQUE
En el método STING, el área se visualiza como celdas rectangulares. Los niveles de celdas significan diferentes niveles de resolución. Se muestra a continuación:
Para cada celda, la información estadística se puede calcular para responder las consultas.
podemos realizar muchas operaciones de agregación como MIN, MAX, COUNT (utilizando la información disponible en las celdas de nivel inferior) para calcular los valores de las celdas de nivel superior.
W ave cluster es un enfoque de agrupamiento de resolución múltiple que utiliza el método wavelet.
CLIQUE (Clustering in Quest) es una combinación de clustering basado en densidad y clustering basado en cuadrícula. Encuentra subespacios utilizando el principio de Apriori. Después de eso, encuentre unidades densas y luego unidades densas conectadas. Finalmente encuentre las regiones máximas que cubren un grupo de unidades densas conectadas. También se puede calcular la cobertura mínima para cada grupo.