El algoritmo MCL es la abreviatura del algoritmo de clúster de Markov, un algoritmo de clúster no supervisado rápido y escalable para gráficos (también conocido como redes) basado en la simulación de flujo (estocástico) en los gráficos. El algoritmo fue inventado / descubierto por Stijn van Dongen (es decir, yo) en el Centro de Matemáticas e Informática (también conocido como CWI) en los Países Bajos. La tesis de doctorado La agrupación de gráficos por simulación de flujo se centra en este algoritmo, siendo los temas principales la teoría matemática detrás de él, su posición en el análisis de conglomerados y la agrupación de gráficos, cuestiones relacionadas con la escalabilidad, la implementación y la evaluación comparativa, y los criterios de rendimiento para la agrupación de gráficos en general . El trabajo para esta tesis se llevó a cabo bajo la supervisión de Jan van Eijck y Michiel Hazewinkel. La tesis, los informes técnicos y las preimpresiones se pueden encontrar en esta sección.
El autor redujo la complejidad de MCL regular para el peor de los casos de O (n3) a O (nk), donde n representa el número de nodos yk el grado máximo del nodo. Se enoja cuando alguien llama al algoritmo MCL no escalable. También agregó algunas características para la regulación de la cantidad de clúster. Sin embargo, MCL tuvo varios otros problemas serios, y nadie sabe si están resueltos. Por ejemplo, el problema de la inestabilidad de la cantidad de clústeres (nuestro pequeño experimento había revelado un componente relacionado gigante y muchos clústeres pequeños de 2 a 3 nodos, pero, probablemente, no pudimos encontrar el identificador requerido
- ¿Puede word2vec considerarse aprendizaje profundo?
- ¿Será la Universidad de Gotemburgo un buen lugar para estudiar el procesamiento del lenguaje natural con CLASP en camino?
- ¿Cuáles son las diferencias entre Apache Spark y el Tensor Flow de Google?
- ¿Es posible guardar el estado de una red neuronal?
- Cómo evaluar la agrupación de k-medias en R