A mi entender, el algoritmo LBG es un algoritmo K-means con una extensión.
El algoritmo K-means requerirá que elija un número entero k que especifique el número esperado de clústeres y proceda a calcular los centros óptimos alternando entre actualizar las membresías (ya sea duras o blandas) de los puntos de datos y luego actualizar los centros de clústeres.
El algoritmo LBG agregará un algoritmo de división a esto e iterará en K-means. Después de aplicar K-means con una K fija, el algoritmo dividirá las membresías de cada centro de clúster en dos nuevos centros de clúster que duplicarán la K.
- ¿Para qué sirve el aprendizaje automático?
- ¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?
- ¿Cuál es mejor? ¿AI o machine learning nanodegree por Udacity?
- ¿Qué es una explicación intuitiva de los coeficientes de regresión logística?
- ¿Cuáles son los tipos de problemas que se pueden resolver con las redes neuronales?
En efecto, LBG es una extensión de K-means que es adecuada para encontrar vectores de libro de códigos que están bien distribuidos entre sus datos. Aquí, vanilla K-means tiene la desventaja de que debe especificar K arbitrariamente y nada le garantiza que los vectores estén bien distribuidos sobre sus datos.
Sin embargo, si no es adecuado para problemas en los que conoce el número deseado de grupos y desea encontrar sus centros porque la regla de división tiene poco sentido para este tipo de problema.