¿Puedes explicar la agrupación en cuadrícula en la minería de datos?

Utiliza una estructura de datos de cuadrícula de resolución múltiple para la agrupación.

Tipos:

1) STING (Apporach de cuadrícula de información estadística)

2) Grupo de ondas

3) CLIQUE

En el método STING, el área se visualiza como celdas rectangulares. Los niveles de celdas significan diferentes niveles de resolución. Se muestra a continuación:

Para cada celda, la información estadística se puede calcular para responder las consultas.

podemos realizar muchas operaciones de agregación como MIN, MAX, COUNT (utilizando la información disponible en las celdas de nivel inferior) para calcular los valores de las celdas de nivel superior.

W ave cluster es un enfoque de agrupamiento de resolución múltiple que utiliza el método wavelet.

CLIQUE (Clustering in Quest) es una combinación de clustering basado en densidad y clustering basado en cuadrícula. Encuentra subespacios utilizando el principio de Apriori. Después de eso, encuentre unidades densas y luego unidades densas conectadas. Finalmente encuentre las regiones máximas que cubren un grupo de unidades densas conectadas. También se puede calcular la cobertura mínima para cada grupo.

More Interesting

¿Qué conjunto de habilidades debe poseer uno para obtener un trabajo en ciencia de datos o análisis?

¿Qué tan útil es 'Big Data'?

Soy un desarrollador de Java pero quiero hacer un doctorado en ciencia de datos de Canadá. ¿Cuáles son las buenas universidades en Canadá y cuáles son sus requisitos?

Cómo diseñar un currículo para enseñarme estadísticas

¿Qué debo estudiar como programador en caso de que quiera obtener un trabajo en Big Data?

¿Cómo manejan los científicos de datos las tareas de aprendizaje automático con características correlacionadas?

Cómo encontrar las publicaciones más populares en un sitio web

¿Cómo es una maestría en análisis de negocios y big data en IE School of Social and Behavioral Sciences?

¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

¿Cuál es la diferencia entre datos e información en términos informáticos?

¿Cómo puede un servicio de coincidencia de datos ayudarlo a obtener una ventaja competitiva?

¿Cuáles son las aplicaciones de la ciencia de datos en física?

Cómo usar Kaggle (empresa) si soy un principiante en el campo de la ciencia de datos y quiero publicar un trabajo de investigación lo antes posible y no tengo experiencia previa

¿Cuál es la diferencia entre el análisis de datos con Python y el análisis de datos con Python en Apache Spark?

¿Qué son los datos de alta dimensión en Big Data?