pagerank
2016-07-13 13:04
239 查看
PageRank算法[编辑]
简易版本[编辑]
假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
PR(A)=PR(B)+PR(C)+PR(D)
PR(A)=PR(B)+PR(C)+PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面总共只有一票。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。
PR(A)=PR(B)2+PR(C)1+PR(D)3
换句话说,根据连出总数平分一个页面的PR值。
PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)
最后,所有这些被换算为一个百分比再乘上一个系数 {\displaystyle d} d。由于“没有向外链接的页面”传递出去的PageRank会是0,所以通过数学系统给了每个页面一个最小值 (1−d)/N:
PR(A)=(PR(B)L(B)+PR(C)L(C)+PR(D)L(D)+⋯)d+1−dN
要注意在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是1−d,而不是这里的 (1−d)/N。 所以一个页面的PageRank是由其他页面的PageRank计算得到。不断的重复计算可以得到所有网页的PageRank。如果给每个网页一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。
简易版本[编辑]
假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
PR(A)=PR(B)+PR(C)+PR(D)
PR(A)=PR(B)+PR(C)+PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面总共只有一票。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。
PR(A)=PR(B)2+PR(C)1+PR(D)3
换句话说,根据连出总数平分一个页面的PR值。
PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)
最后,所有这些被换算为一个百分比再乘上一个系数 {\displaystyle d} d。由于“没有向外链接的页面”传递出去的PageRank会是0,所以通过数学系统给了每个页面一个最小值 (1−d)/N:
PR(A)=(PR(B)L(B)+PR(C)L(C)+PR(D)L(D)+⋯)d+1−dN
要注意在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是1−d,而不是这里的 (1−d)/N。 所以一个页面的PageRank是由其他页面的PageRank计算得到。不断的重复计算可以得到所有网页的PageRank。如果给每个网页一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。
相关文章推荐
- caffe BasePrefetchingDataLayer 学习
- 查询数据库每张表记录条数
- django crsf not set问题
- “暑假”学习开学典礼
- 关于苹果手机的真机调试
- UI开发学习指南
- PHP通用分页(Pager)类
- MVC学习 (一)
- 转载 asp.net中ViewState的用法详解
- VXLAN大二层实现穿越互联网通过DHCP服务器获取IP地址
- 2015ACM-ICPC 北京赛区 Problem I. Snake Carpet
- 阅读Logback文档笔记--Logback的Configuration配置
- 阅读Logback文档笔记--LogBack架构
- HDU 3068 最长回文 最长回文子串
- 1009. 说反话 (20)
- 图片 CSS3图片拖拽碰撞感应特效
- Redis之——CentOS 6.5安装配置redis
- 【抚琴煮酒】我们的网站压力究竟在哪里?
- mac切换jdk版本
- bean的加载(十一)初始化bean