¿Qué es el algoritmo de agrupación de Markov?

El algoritmo MCL es la abreviatura del algoritmo de clúster de Markov, un algoritmo de clúster no supervisado rápido y escalable para gráficos (también conocido como redes) basado en la simulación de flujo (estocástico) en los gráficos. El algoritmo fue inventado / descubierto por Stijn van Dongen (es decir, yo) en el Centro de Matemáticas e Informática (también conocido como CWI) en los Países Bajos. La tesis de doctorado La agrupación de gráficos por simulación de flujo se centra en este algoritmo, siendo los temas principales la teoría matemática detrás de él, su posición en el análisis de conglomerados y la agrupación de gráficos, cuestiones relacionadas con la escalabilidad, la implementación y la evaluación comparativa, y los criterios de rendimiento para la agrupación de gráficos en general . El trabajo para esta tesis se llevó a cabo bajo la supervisión de Jan van Eijck y Michiel Hazewinkel. La tesis, los informes técnicos y las preimpresiones se pueden encontrar en esta sección.

El autor redujo la complejidad de MCL regular para el peor de los casos de O (n3) a O (nk), donde n representa el número de nodos yk el grado máximo del nodo. Se enoja cuando alguien llama al algoritmo MCL no escalable. También agregó algunas características para la regulación de la cantidad de clúster. Sin embargo, MCL tuvo varios otros problemas serios, y nadie sabe si están resueltos. Por ejemplo, el problema de la inestabilidad de la cantidad de clústeres (nuestro pequeño experimento había revelado un componente relacionado gigante y muchos clústeres pequeños de 2 a 3 nodos, pero, probablemente, no pudimos encontrar el identificador requerido

El algoritmo MCL es la abreviatura del algoritmo de clúster de Markov , un algoritmo de clúster no supervisado rápido y escalable para gráficos (también conocido como redes ) basado en la simulación de flujo (estocástico) en los gráficos. El algoritmo fue inventado / descubierto por Stijn van Dongen (es decir, yo) en el Centro de Matemáticas e Informática (también conocido como CWI) en los Países Bajos. La tesis de doctorado La agrupación de gráficos por simulación de flujo se centra en este algoritmo, siendo los temas principales la teoría matemática detrás de él, su posición en el análisis de conglomerados y la agrupación de gráficos, cuestiones relacionadas con la escalabilidad, la implementación y la evaluación comparativa, y los criterios de rendimiento para la agrupación de gráficos en general . El trabajo para esta tesis se llevó a cabo bajo la supervisión de Jan van Eijck y Michiel Hazewinkel. La tesis, los informes técnicos y las preimpresiones se pueden encontrar en esta sección. Para tener una idea rápida de cómo funciona MCL, considere el flujo gráfico en la parte superior de esta página, o incluso mejor, eche un vistazo a una animación del proceso de MCL.

La interfaz básica para el algoritmo es muy simple: solo necesita una opción (el indicador -I ) para llegar al meollo del mismo, y para gráficos grandes también debe tener en cuenta el indicador de esquema para regular los recursos. El enfoque predeterminado es variar el argumento a -I durante un intervalo (haciendo una ejecución de mcl para cada valor) y analizar la salida de agrupación con los otros programas que vienen con MCL (consulte los manuales de mcl).

Para obtener una descripción completa del algoritmo y el proceso de MCL, se recomienda leer uno de los informes técnicos entre las publicaciones. También es posible ver una introducción algo más larga o una introducción a algunas de las matemáticas asociadas con MCL.

Esta es la implementación del algoritmo MCL en VisualBasic. Es solo para fines de demostración.
Las modificaciones futuras eventualmente lo harán útil para aplicaciones científicas.
Por el momento, solo muestra el algoritmo MCL en un gráfico ficticio completamente conectado con puntajes de similitud basados ​​en distancias de píxeles.

Para más consultas: –

Tutoriales de Liceo

Tutoriales de Lyceumtutorials para IIT JEE, MHT-CET, Medical, XII, XI, Tutoriales de Lyceum Mumbai

Lyceum Tutorials es el mejor entrenamiento de IIT

More Interesting

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Cómo revolucionaría el mundo la PNL perfecta por computadoras?

¿Cómo funciona realmente el Detector MultiBox Single-Shot (SSD)?

¿Scikit-learn admite paralelismo, es decir, se puede usar en un grupo de máquinas que ejecutan tareas en paralelo?

¿Cómo se puede aplicar el aprendizaje automático al póker?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Cómo comenzarías en Computación ubicua y programación para ello?

¿Cuál es la teoría detrás de ingresar una imagen en una red neuronal?

¿Qué es exactamente el sobreajuste? ¿Por que sucede? ¿Cómo afecta a mi modelo?

Cómo integrar el marco Tensorflow con XGBoost

¿Cómo se usan los árboles BSP (partición de espacio binario) en los algoritmos de aprendizaje automático?

¿En qué se diferencia el método de agrupamiento en el aprendizaje automático de disparar una consulta SQL 'select' para agrupar personas u objetos? ¿Cuáles son las diferencias y necesidades reales?

Cómo construir un sistema de recomendación de itinerario basado en las preferencias del usuario

¿Cuáles son las mejores prácticas para garantizar que los datos adquiridos de la investigación que implica el análisis de Big Data resulten precisos y útiles?

¿Cuál es mejor para la manipulación de datos en python: Pandas o SFrame?