¿Es más o menos probable que un miembro de un grupo particular de partes interesadas (A) reciba un empate en comparación con un miembro de un grupo diferente de partes interesadas (B)?
Esta sería una pregunta muy importante para el discurso político o el trabajo sociológico.
En los primeros días del análisis de redes sociales, los sociólogos simplemente calculaban las puntuaciones de centralidad de cada grupo y luego realizaban un análisis estadístico bidireccional para medir si el grupo A tenía, en promedio, una mayor centralidad que el grupo B.
- ¿Es una buena idea pasar a Big Data (Hadoop)? Tengo más de 11 años de experiencia en .NET y C ++.
- ¿Qué carreras significativas existen en la ciencia de datos (estadísticas / ML / optimización)?
- Cómo aprender Python con respecto al desarrollo de Big Data
- Hay varios cursos disponibles sobre ciencia de datos y análisis como Udaicity, Upgrad Imarticus, etc. ¿Cuál es el mejor para unirse?
- ¿Cómo se conecta Internet? ¿Cómo se transfieren los datos? ¿Cómo se accede a los datos desde diferentes países?
Desafortunadamente, hicieron una suposición errónea: los datos del grupo parecían independientes, pero no lo eran .
Los valores de centralidad en los gráficos sociales no satisfacen el requisito de independencia para el análisis estándar de las pruebas de varianza. Cualquier miembro del Grupo A podría estar fuertemente influenciado por los valores del Grupo B. Considere el caso de “una estrella” donde un miembro del grupo A está rodeado por miembros del Grupo B.
Además, hay tendencias conocidas sobre cómo se forman los gráficos sociales. Los apegos preferenciales, la transitividad (los amigos de los amigos también son amigos) y la mutualidad son todos elementos del gráfico social que pueden confundir las pruebas estadísticas regulares.
La solución se llama “ergm” o modelos de gráficos aleatorios exponenciales, y requieren conocimientos de análisis de datos bastante avanzados. Hay un paquete en R para llevarlo a cabo con bastante rapidez, aunque comprender el método puede ser complicado.
Básicamente, propone modelos de análisis (aristas + grupo A + grupo B + transitividad + …) y realiza miles de simulaciones de cadena de Markov para probar el grado de “ajuste” que el modelo tiene al gráfico empírico. Usando la cadena de markov monte carlo (MCMC), también puede producir coeficientes basados en la probabilidad máxima de registro de que cada miembro resulte en un empate. Luego, compara ese modelo con cualquier número de modelos posibles para ver cuál se ajusta mejor.
Pasar por ergms es un ensayo en sí mismo, pero hay tutoriales que lo cubren bastante bien. Definitivamente valen la pena un vistazo.