您的位置：首页 > 其它

pageRank

2016-01-27 15:51 330 查看

早起的搜索引擎是基于信息检索的，但是后来人们发现，只是根据相似度来返回用户需要的内容，效果不是很好。于是提出了Hyperlinks的思想。

其中两个比较经典的算法是PageRank和HITS。而Google就是靠着PageRank发家致富。下面结合实例让大家知道PageRank是怎么工作的。

pagerank，顾名思义，就是为每一个网页计算出一个值，按照这个值来给网页排序，值一般就是1-10，值越大，表示网页越重要。

pagerank有两个思想：越多的网页指向自己，说明自己越重要；网页的重要性不同，指向的权值也不一样。

有些网页不指向其他网页，为了解决这个问题，提出了一个阻尼系数q，表示继续往下浏览的概率，一般取0.85 。

如果没有q的存在，A矩阵直接就可以用概率转置矩阵。

不断地进行AX=R迭代，直到R收敛（基本保持不变）。

R向量中的每一个值都表示一个网页的最终的pagerank值。

x表示每个网页初始的pagarank值，一般设为1 。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 数据挖掘搜索引擎 PageRank 经典算法信息检索

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部