¿Por qué el PageRank es muy alto para los nodos en un gráfico con indegree cero?

¿Estás seguro de que implementaste el algoritmo correctamente? ¿Se basa su algoritmo en las fórmulas encontradas en el artículo de Wikipedia [1]?

La idea detrás de PageRank es que cada nodo puede votar por la importancia en otros nodos al tener un borde dirigido a estos otros nodos. Los nodos con un grado de entrada alto (relativo) se consideran más importantes que los nodos con grado de entrada bajo o sin grado de entrada. Además, los votos provenientes de nodos importantes se consideran más valiosos que los votos de nodos no tan importantes. La imagen en Wikipedia [2] demuestra esta idea bastante bien, creo.

La fórmula que captura esta idea es la siguiente:

[matemáticas] PR (p_ {i}) = \ frac {1-d} {N} + d \ sum_ {p_ {j} \ en M (p_ {i})} \ frac {PR (p_ {j}) } {L (P_ {j})} [/ matemáticas]

Donde [math] d [/ math] es un factor de amortiguación, [math] N [/ math] es el número de nodos, [math] PR (p_ {j}) [/ math] el PageRank de la página [math] p_ {j} [/ math] y [math] L (P_ {j}) [/ math] el límite de la página [math] p_ {j} [/ math].

La primera parte de esta fórmula, que es [matemática] \ frac {1-d} {N} [/ matemática], puede considerarse como un tipo de probabilidad de que el nodo dado sea seleccionado al azar (es decir, todos los nodos son al menos un poco importante). Es constante para todos los nodos en el gráfico. La segunda parte de la fórmula suma todos los nodos entrantes al nodo dado. Para cada uno de estos nodos, el PageRank se divide por el número de bordes de salida. Esto significa que el PageRank de un nodo está dividido sobre los nodos a los que tiene enlaces salientes.

Ahora para responder a su pregunta: según la fórmula del PageRank, es fácil ver que un nodo con indegree cero tiene un PageRank de [math] \ frac {1-d} {N} [/ math]. Solo la primera parte de la fórmula agrega algún valor al PageRank, ya que la segunda parte será igual a cero; no hay enlaces entrantes para resumir. Este valor puede ser alto en el sentido de que es mayor que cero y esto depende de su elección del valor de [math] d [/ math]. Sin embargo, los nodos con grado de entrada mayor que cero deben tener un PageRank más alto que los nodos con grado de entrada igual a cero. Esto también tiene sentido si traduce esto a la idea de PageRank: los nodos con indegree cero no deben considerarse importantes.

[1] http://en.wikipedia.org/wiki/Pag…
[2] http://en.wikipedia.org/wiki/Fil…

More Interesting

¿Aprender Linux es importante para un estudiante de ciencias de la computación?

Entre USC, UC Irvine y UC Davis, ¿qué universidad es el mejor lugar para obtener un Máster en Informática en términos de actividades de investigación actuales y oportunidades de pasantías disponibles?

¿Por qué parece haber tan poca investigación en informática reconfigurable?

¿Pueden dos estudiantes publicar un artículo de revista de forma independiente?

Ciencias de la Computación: ¿Cuán competitivo es el premio al mejor trabajo estudiantil en SODA?

¿Cuál es el propósito de las carpetas ocultas $ recycle.bin y de datos del programa en la unidad C?

¿Hay algún buen tema de investigación en arquitectura de computadoras que involucre programación para mostrar resultados finales?

¿Cuáles son los temas más candentes para una tesis de maestría en sistemas informáticos? (2013-2015)

¿Qué profesores y laboratorios de investigación en la India están trabajando en el procesamiento del lenguaje natural?

¿Cuáles son los temas de investigación adecuados para un estudiante de licenciatura en computación en la nube?

¿Se ha saturado el alcance de la investigación para sistemas operativos y desarrollo de kernel?

¿Qué habilidades se necesitan para ser un informático teórico?

¿Cuáles podrían ser los temas de investigación en el área de modelos gráficos probabilísticos?

¿Cómo debe prepararse un estudiante de ingeniería de segundo año de CS recién ascendido para una pasantía de investigación en Microsoft?

¿Cuánto diseño de algoritmos hacen los investigadores de aprendizaje automático?