您的位置:首页 > 其它

pagerank

2016-07-13 13:04 239 查看
PageRank算法[编辑]

简易版本[编辑]

假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

PR(A)=PR(B)+PR(C)+PR(D)

PR(A)=PR(B)+PR(C)+PR(D)

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面总共只有一票。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

PR(A)=PR(B)2+PR(C)1+PR(D)3

换句话说,根据连出总数平分一个页面的PR值。

PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)

最后,所有这些被换算为一个百分比再乘上一个系数 {\displaystyle d} d。由于“没有向外链接的页面”传递出去的PageRank会是0,所以通过数学系统给了每个页面一个最小值 (1−d)/N:

PR(A)=(PR(B)L(B)+PR(C)L(C)+PR(D)L(D)+⋯)d+1−dN

要注意在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是1−d,而不是这里的 (1−d)/N。 所以一个页面的PageRank是由其他页面的PageRank计算得到。不断的重复计算可以得到所有网页的PageRank。如果给每个网页一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: