¿Estás seguro de que implementaste el algoritmo correctamente? ¿Se basa su algoritmo en las fórmulas encontradas en el artículo de Wikipedia [1]?
La idea detrás de PageRank es que cada nodo puede votar por la importancia en otros nodos al tener un borde dirigido a estos otros nodos. Los nodos con un grado de entrada alto (relativo) se consideran más importantes que los nodos con grado de entrada bajo o sin grado de entrada. Además, los votos provenientes de nodos importantes se consideran más valiosos que los votos de nodos no tan importantes. La imagen en Wikipedia [2] demuestra esta idea bastante bien, creo.
La fórmula que captura esta idea es la siguiente:
- ¿Por qué la investigación en informática en IIIT-H tiende a ser más aplicada que fundamental?
- ¿Qué algoritmos se pueden usar para agrupar opiniones sobre un tema expresado en lenguaje natural?
- ¿Qué hacen los investigadores de seguridad informática?
- ¿Cómo empiezo a aprender informática distribuida?
- ¿Cómo debo decirle a mi profesor sobre mi tema de investigación? Soy un nuevo estudiante de doctorado en informática.
[matemáticas] PR (p_ {i}) = \ frac {1-d} {N} + d \ sum_ {p_ {j} \ en M (p_ {i})} \ frac {PR (p_ {j}) } {L (P_ {j})} [/ matemáticas]
Donde [math] d [/ math] es un factor de amortiguación, [math] N [/ math] es el número de nodos, [math] PR (p_ {j}) [/ math] el PageRank de la página [math] p_ {j} [/ math] y [math] L (P_ {j}) [/ math] el límite de la página [math] p_ {j} [/ math].
La primera parte de esta fórmula, que es [matemática] \ frac {1-d} {N} [/ matemática], puede considerarse como un tipo de probabilidad de que el nodo dado sea seleccionado al azar (es decir, todos los nodos son al menos un poco importante). Es constante para todos los nodos en el gráfico. La segunda parte de la fórmula suma todos los nodos entrantes al nodo dado. Para cada uno de estos nodos, el PageRank se divide por el número de bordes de salida. Esto significa que el PageRank de un nodo está dividido sobre los nodos a los que tiene enlaces salientes.
Ahora para responder a su pregunta: según la fórmula del PageRank, es fácil ver que un nodo con indegree cero tiene un PageRank de [math] \ frac {1-d} {N} [/ math]. Solo la primera parte de la fórmula agrega algún valor al PageRank, ya que la segunda parte será igual a cero; no hay enlaces entrantes para resumir. Este valor puede ser alto en el sentido de que es mayor que cero y esto depende de su elección del valor de [math] d [/ math]. Sin embargo, los nodos con grado de entrada mayor que cero deben tener un PageRank más alto que los nodos con grado de entrada igual a cero. Esto también tiene sentido si traduce esto a la idea de PageRank: los nodos con indegree cero no deben considerarse importantes.
[1] http://en.wikipedia.org/wiki/Pag…
[2] http://en.wikipedia.org/wiki/Fil…