Supongamos que reuní a todos los usuarios de Twitter que escribieron tweets con las palabras “aprendizaje automático” en ellos (durante el último mes, por ejemplo), y luego construí un gráfico de red basado en sus seguidores. Además de las diversas medidas de centralidad, ¿qué otras técnicas podría utilizar para identificar a las mejores personas a seguir? ¿Cómo lo hace Klout?

Una cosa de la que debería tener cuidado es solo mirar tweets con palabras clave como ‘aprendizaje automático’. La razón es que hay muchas conversaciones sobre el aprendizaje automático que no implican las palabras ‘aprendizaje automático’. Por ejemplo, una conversación sobre qué clasificador usar para un problema.

Hay un artículo llamado ‘Nowcasting Events from the Social Web with Statistical Learning’ por Vasileios Lampos y Nello Cristianini:

http: //eprints.pascal-network.or…

que habla de fuentes mineras como Wikipedia para palabras clave derivadas de palabras clave relacionadas con el tema. Sin embargo, el documento se centra en el aprendizaje supervisado y no estoy muy seguro de cómo adaptar su técnica para enfoques no supervisados.

En cuanto a la agrupación de personas, no estoy seguro de si las medidas de centralidad darán buenos resultados. El hecho de que ciertas personas tengan muchos seguidores no significa que sean las más interesantes para usted. Algunas de las personas que encuentro más interesantes no tienen muchos seguidores.
Si ya tiene una lista de personas que hablan sobre el aprendizaje automático en Twitter, quizás una mejor manera de encontrar personas interesantes sería comparar las personas que encuentra con los amigos que ya tiene.

Utilice un enfoque HITS / PageRank para determinar quiénes son las personas que siguen otras personas buenas. En lugar del término aprendizaje automático, puede comenzar con una semilla de personas y luego continuar expandiéndose según su lista de conteo de frecuencias siguientes.