¿Cuáles son algunos métodos de diagnóstico utilizados en un algoritmo de agrupamiento?

La agrupación se utiliza para dividir un conjunto de datos en grupos similares (grupos) de elementos u objetos en el conjunto de datos. A continuación se presentan algunos diagnósticos para probar la calidad de los clústeres obtenidos mediante la aplicación de un algoritmo de clúster:

  1. Dentro de la “distancia” del grupo, que es el promedio de las distancias de los elementos dentro de los grupos. El mejor algoritmo es el que tiene el menor valor de distancia de distancia, para asegurarse de que los elementos del clúster estén lo más cerca posible entre sí.
  2. Entre la distancia del grupo: la distancia entre los centros del grupo. El mejor algoritmo es el que da como resultado la mayor distancia, de modo que el grupo esté lo más lejos posible el uno del otro.
  3. Diferentes características / atributos que caracterizan a cada grupo que permitirá un etiquetado claro de cada grupo, por ejemplo, en la segmentación del mercado: grupo de jóvenes y de alto gasto, grupo de buscadores de calidad de mediana edad, grupo de mayores ahorradores. Las características significativas que caracterizan a los clústeres generalmente se toman como las características con el valor promedio estadísticamente más significativo en el clúster.