No había visto esta medida antes. Parece bastante razonable, ciertamente de acuerdo con las pruebas presentadas en el documento.
Me imagino que una debilidad es calcular las distancias de todos los pares dentro de cada grupo. Muestran que el muestreo es suficiente pero agrega cierta complejidad.
Tampoco es una función convexa o monotónica, lo que hace que sea un poco más difícil evaluar el punto óptimo. Al ser una especie de estadística ‘relativa’, no te ayuda a decidir cuándo no hay grupos significativos.
- ¿Es posible que una aplicación de aprendizaje automático que ejecute el mismo algoritmo y se alimente con los mismos datos para aprender cosas diferentes en pruebas de entrenamiento separadas?
- ¿Por qué Microsoft decidió usar bosques aleatorios en el Kinect?
- Después de seleccionar entidades con una regresión regularizada, ¿es mejor estimar el resultado con la misma regresión regularizada o con una regresión no regularizada?
- ¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?
- ¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?
Finalmente, puede ver en el primer diagrama una debilidad, que es que para k muy pequeña, las distancias esperadas dentro del clúster son grandes y, por lo tanto, presentan una ‘barra baja’. Cualquier cosa se ve bien en relación con esta medida para k pequeña, por lo que creo que es difícil obtener una lectura de datos con solo unos pocos grupos.