Los algoritmos de agrupamiento jerárquico son de arriba hacia abajo o de abajo hacia arriba.
1. Los algoritmos ascendentes tratan cada documento como un grupo único al principio y luego combinan (o aglomeran ) sucesivamente pares de grupos hasta que todos los grupos se hayan fusionado en un solo grupo que contiene todos los documentos. Por lo tanto, la agrupación jerárquica ascendente se denomina agrupación jerárquica aglomerativa HAC .
2. La agrupación de arriba hacia abajo requiere un método para dividir un clúster. Continúa dividiendo los grupos de forma recursiva hasta que se alcanzan los documentos individuales.
Proceso de HAC:
- Asigne cada objeto a un clúster separado.
- Evaluar todas las distancias por pares entre grupos.
- Construya una matriz de distancia usando los valores de distancia.
- Busque el par de grupos con la distancia más corta.
- Retire el par de la matriz y fusionarlos.
- Evalúe todas las distancias desde este nuevo clúster a todos los otros clústeres y actualice la matriz.
- Repita hasta que la matriz de distancia se reduzca a un solo elemento.
Fuentes:
1. Agrupación jerárquica aglomerativa
2. Descripción general del agrupamiento jerárquico aglomerativo
- ¿Qué 2 cursos entre estructuras de datos y algoritmos, diseño de software, introducción a IA, aprendizaje automático y sistemas operativos, debo elegir?
- ¿Cómo debo usar máquinas restringidas de Boltzmann para el filtrado colaborativo?
- ¿Cómo se implementa una red neuronal convolucional (CNN) con la estructura de un árbol binario en TensorFlow?
- ¿Puedo controlar las señales neuronales desde un lugar?
- ¿Debo usar la validación cruzada k-fold para un clasificador de bosque aleatorio?