A2A.
Primero, no existe un método infalible para determinar el número óptimo de grupos. Esto es esencialmente una manifestación de la compensación de la variación de sesgo en el aprendizaje automático: si utiliza un modelo muy complejo (grandes [matemáticas] k [/ matemáticas]), se ajusta el ruido (demasiados grupos, con objetos divididos en varios grupos más pequeños basados en diferentes tonos); si utiliza un modelo muy simple (pequeño [matemático] k [/ matemático]), perderá el patrón (muy pocos grupos, con varios objetos agrupados en un solo grupo). No hay forma de separar de manera óptima el ruido del patrón. Si lo hubiera, el aprendizaje automático se resolvería en gran medida.
Dicho esto, hay varias heurísticas que se pueden usar para elegir un buen valor de [math] k [/ math]. De hecho, Wikipedia tiene un artículo dedicado a este mismo problema: determinar el número de clústeres en un conjunto de datos.
- ¿Cómo se realiza la reducción del tiempo polinómico de UHAMPATH a UHAMCYCLE?
- ¿Los programadores realmente implementan los algoritmos, o usan los que se dan en las bibliotecas? (como usar HashMap en Java)
- ¿Cuál es el principio principal del algoritmo de búsqueda binaria?
- Cómo escribir un programa en C para implementar un algoritmo de planificación de prioridades, junto con la visualización del diagrama de Gantt
- ¿Qué cosas debes saber antes de aprender algoritmos?
Puede usar otros algoritmos, como la agrupación jerárquica o la agrupación no paramétrica, que no requerirá directamente que elija la cantidad de agrupaciones, pero requerirá ajustar algunos otros parámetros que, a su vez, afectan la cantidad de agrupaciones.