您的位置:首页 > 其它

pageRank

2016-01-27 15:51 330 查看


早起的搜索引擎是基于信息检索的,但是后来人们发现,只是根据相似度来返回用户需要的内容,效果不是很好。于是提出了Hyperlinks的思想。

其中两个比较经典的算法是PageRank和HITS。而Google就是靠着PageRank发家致富。下面结合实例让大家知道PageRank是怎么工作的。

pagerank,顾名思义,就是为每一个网页计算出一个值,按照这个值来给网页排序,值一般就是1-10,值越大,表示网页越重要。

pagerank有两个思想:越多的网页指向自己,说明自己越重要;网页的重要性不同,指向的权值也不一样。

有些网页不指向其他网页,为了解决这个问题,提出了一个阻尼系数q,表示继续往下浏览的概率,一般取0.85 。

如果没有q的存在,A矩阵直接就可以用概率转置矩阵。

不断地进行AX=R迭代,直到R收敛(基本保持不变)。

R向量中的每一个值都表示一个网页的最终的pagerank值。

x表示每个网页初始的pagarank值,一般设为1 。





内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息