pageRank
2016-01-27 15:51
330 查看
早起的搜索引擎是基于信息检索的,但是后来人们发现,只是根据相似度来返回用户需要的内容,效果不是很好。于是提出了Hyperlinks的思想。
其中两个比较经典的算法是PageRank和HITS。而Google就是靠着PageRank发家致富。下面结合实例让大家知道PageRank是怎么工作的。
pagerank,顾名思义,就是为每一个网页计算出一个值,按照这个值来给网页排序,值一般就是1-10,值越大,表示网页越重要。
pagerank有两个思想:越多的网页指向自己,说明自己越重要;网页的重要性不同,指向的权值也不一样。
有些网页不指向其他网页,为了解决这个问题,提出了一个阻尼系数q,表示继续往下浏览的概率,一般取0.85 。
如果没有q的存在,A矩阵直接就可以用概率转置矩阵。
不断地进行AX=R迭代,直到R收敛(基本保持不变)。
R向量中的每一个值都表示一个网页的最终的pagerank值。
x表示每个网页初始的pagarank值,一般设为1 。
相关文章推荐
- 微信搜一搜迈出新的一步,好戏来了
- AJAX 支持搜索引擎问题分析
- 搜索引擎对关键词作弊判断方法揭密
- 使用php记录用户通过搜索引擎进网站的关键词
- android将搜索引擎设置为中国雅虎无法搜索问题解决方法
- 数据挖掘之Apriori算法详解和Python实现代码分享
- Asp.Net、asp实现的搜索引擎网址收录检查程序
- 如何让搜索引擎抓取AJAX内容解决方案
- PHP判断来访是搜索引擎蜘蛛还是普通用户的代码小结
- php实现判断访问来路是否为搜索引擎机器人的方法
- php获取从百度、谷歌等搜索引擎进入网站关键词的方法
- 解析PHP对现有搜索引擎的调用
- C#判断访问来源是否为搜索引擎链接的方法
- WordPress特定文章对搜索引擎隐藏或只允许搜索引擎查看
- PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT
- apache禁止搜索引擎收录、网络爬虫采集的配置方法
- 如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
- PHP统计nginx访问日志中的搜索引擎抓取404链接页面路径
- 详解BI/数据分析/数据挖掘/业务分析概念 7fe0
- Sedgewick之巨著《算法》,与高德纳TAOCP一脉相承