搜素引擎优化工作原理
2012-04-01 14:44
183 查看
解搜索引擎工作原理繁多复杂,大致一般分为三大步奏:爬行和抓取,建立索引和排名。当然SEO优化网站,目的在于提高关键词排名,增加产品曝光率。为此SEOer们更加看重排名这一环节,搜索引擎工作原理有些?
一、对提交的搜索请求分析
搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。
1、中文分词
中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。
百度中文分词常见的以下三种:
a、基于字符串匹配
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。
正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。
逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。
最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。
b、理解分词方法
理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。
c、统计分词方法
相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词。我们常常不是使用粗体,黑体这些吗?原因还在于这对于搜索引擎理解同样有利。
2、去掉停止词
搜索用户在键入关键词时,或多或少会出现不少停止词,这样才能最大限度的显示最相关,最能够满足用户体验的结果页面。
3、处理符号
搜索引擎还是很看重标点符号的,因此我们SEOer在编辑文章的时候,应当注意标点符号的网站优化合理使用,尤其是在文章标题上。
二、匹配搜索请求
当搜索引擎接收到搜索请求详细分析之后,便会匹配URL(当然重点是标题和摘要片段),匹配的URL成千上万个,怎样才能有序显示出来了,这就需要搜索引擎按URL的匹配程度排序。
三、对匹配网页排名
为匹配的网页排序,其实就是搜索引擎对匹配的网页进行筛选,挑选的过程,然后按照一定的顺序整理出结构的行为。当然搜索引擎都会给每个网页一个值,即权重,通过判断该网页对搜索引擎和用户体验的价值进行排序排名。提高排名的因素多种多样,目前基本上是参考HITS算法,TrustRank信任指数算法、PR值等等。
一、对提交的搜索请求分析
搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。
1、中文分词
中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。
百度中文分词常见的以下三种:
a、基于字符串匹配
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。
正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。
逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。
最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。
b、理解分词方法
理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。
c、统计分词方法
相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词。我们常常不是使用粗体,黑体这些吗?原因还在于这对于搜索引擎理解同样有利。
2、去掉停止词
搜索用户在键入关键词时,或多或少会出现不少停止词,这样才能最大限度的显示最相关,最能够满足用户体验的结果页面。
3、处理符号
搜索引擎还是很看重标点符号的,因此我们SEOer在编辑文章的时候,应当注意标点符号的网站优化合理使用,尤其是在文章标题上。
二、匹配搜索请求
当搜索引擎接收到搜索请求详细分析之后,便会匹配URL(当然重点是标题和摘要片段),匹配的URL成千上万个,怎样才能有序显示出来了,这就需要搜索引擎按URL的匹配程度排序。
三、对匹配网页排名
为匹配的网页排序,其实就是搜索引擎对匹配的网页进行筛选,挑选的过程,然后按照一定的顺序整理出结构的行为。当然搜索引擎都会给每个网页一个值,即权重,通过判断该网页对搜索引擎和用户体验的价值进行排序排名。提高排名的因素多种多样,目前基本上是参考HITS算法,TrustRank信任指数算法、PR值等等。
相关文章推荐
- web优化必须了解的原理之I/o的五种模型和web的三种工作模式
- JavaScript 如何工作:渲染引擎和性能优化技巧
- hive原理与源码分析-UDxF、优化器及执行引擎(五)
- 海外ASO优化是什么工作原理?
- JavaScript 工作机制:V8 引擎内部机制及如何编写优化代码的 5 个诀窍
- 初尝浏览器工作原理(渲染引擎)
- web优化必须了解的原理之I/o的五种模型和web的三种工作模式
- MySQL5.6中limit的工作机制和order by limit优化原理
- jsp引擎是什么?是什么工作原理?
- 浏览器内核、JS 引擎、页面呈现原理及其优化
- 存储引擎选择是MySQL数据库一项性能优化工作
- Velocity工作原理解析和优化
- web优化必须了解的原理之I/o的五种模型和web的三种工作模式 推荐
- Android:ListView 使用 viewholder 性能优化(Listview工作原理)
- MySQL5.6中limit的工作机制和order by limit优化原理
- 浏览器工作原理(二):渲染引擎的详细介绍
- 浏览器工作原理8-渲染引擎的线程
- 深入解析浏览器的幕后工作原理(二) 呈现引擎
- web优化必须了解的原理之I/o的五种模型和web的三种工作模式
- Velocity工作原理解析和优化