您的位置:首页 > 其它

seo,搜索引擎的规则

2008-12-11 12:35 253 查看
搜索服务,为所有的互联网用户提供了信息查找的方便之门,能够在亿万条网络信息中,准确帮助用户查找到所需要的信息服务。在某种程度上,搜索引擎,在引领着互联网的发展。
下面的文章中,我将讲述我个人对搜索引擎,及搜索引擎服务的理解和阐述。

首先,作为seo工作者,我的工作就是研究搜索引擎的算法,并通过实践找到迎合搜索引擎规则的方式或方法,应用到网站的优化工作中,以提高网站的搜索排名。由于接触seo工作的时间并不是很长,所以现在我只能算作是一名seo爱好者,并以此为谋生的手段,赚取点薪水,填补家用。

  言归正传,我认为作为一名seo工作者,无论你处于什么样的地位或者位置,提出过什么样的优化方法,或者察觉到多少搜索引擎的漏洞,都必须对搜索引擎得发展或者说历史,有所了解,甚至是研究。我记得有这么一句话,"历史,将帮助你追溯源头,发现事物的本源!"。只有了解和研究搜索引擎的概念,技术,发展历程,将会有效的帮助你理解当前搜索引擎的规则。

  在这里,你首先需要知道,就是最初的文件检索功能的主要技术参数,也就是搜索引擎的原型,它的基本运算规则,了解最初的逻辑运算规则,察看相关搜索技术升级以及新技术专利的描述,因为就是这些东西,这些技术的不断发展,不断的更新,才构成了当前的搜索引擎,而搜索引擎的算法,其实就是通过这些技术进行逻辑判断得到的参数,再经过多重计算和判断,最终得出的结果。

  由于这些资料大多都是英文版权,所以我建议阅读者最好用有金山词霸这个软件,或者是使用中英文汉语词典,这将有效的帮助你对文章的理解。

  推荐一篇作为seo工作人员必须要研究的文章《The Anatomy of a Large-Scale Hypertextual Web Search Engine》,这片文章是赛吉-布林与拉里-佩奇所著,也就是google的两位创始人在斯坦福大学毕业前的一片学术文章,中文翻译过来为《剖析一个大型超文本web搜索引擎》。google作为搜索引擎服务当中无可争议的霸主,就是建立在此篇学术文章的理论基础上。有效的阅读,深入地了解,你会发现当前的搜索引擎有很多这片文章种所提到过的参数及其数据设置。

  对以百度搜索同样也是这样,百度的创始人,李彦宏先生在美国时期的专利,《超链接分析》专利,如今也应用在百度搜索上。综上所述,我要表达的主要意思就是,seo的工作,不要只注重当前搜索的排名结果的,你可能能够发现搜索引擎一时的漏洞,你的方式或方法能够得到短期的应用,但如果你不能够把握搜索引擎的方向,了解和掌握搜索引擎的技术信息,那你就无法将seo工作发挥到极致。

  ok,下面我将叙述的是,我个人对百度搜索的一些理解,在文章中,会涉及到一些具体的搜索参数,但由于要获取准确的参数并反映具体的运算公式需要的大量的计算,我个人并没有进行过具体的运算,所以,所提供的参数可能会存在很大的误差,如果有兴趣深入了解的话,可以留意我的联系方式,然后一起探讨。

百度搜索

域名、空间对搜索排名服务的影响

  作seo工作的都知道,网站的空间,域名对搜索引擎及搜索引擎的排名结果会有一定的影响,但影响会有多大,除了参与设定的搜索引擎研发人员外没有人知道,其实像下面我将要说到的网页的title、keywords、description等条件,或者说是因素,它们在搜索引擎排名结果中,都只是搜索运算中的一个参数。

  不同的是,我们可以通过不同的关键词搜索,并通过搜索结果的排名比对,得到大概的答案,这个答案已经被众多的seo工作者所熟知,并已经应用到实际的seo操作中。

.com的域名的网站,在同等条件下,要比.CN的域名的网站具有排名优势。同样的,英文单词组成的域名,要比拼写的域名具有优势。独立单词的域名,要比词组域名有优势。另外,还有许多类似的规则,

例如网站的空间,我个人认为,搜索引擎在更新收录的同时,会给与一定的参数,并作记录。可能会有以下几个参数,根据空间类型,得到一个参数,并根据空间是否独立,给出一个判断,如果是非独立空间,会依据空间分割的数量,给出一个变量。通过一个恒定值比对,或者计算,最终得到一个关于网站空间的最终参数。而这个参数将最终影响到网站权重的分配。

百度对新建站点的扶持

  我个人认为,百度对于新建站点,会提高一定的权重分配。这点可以通过词性定义广泛的关键词搜索结果的比对中可以看到(生僻的关键词)。在此我就不做过多的说明。

收录量的问题

  有的许多人认为,网站的收录量越高,网站的权重就越高。我也持相同观点。但需要说明的是,影响网站权重分配的不单单就只有收录量一个因素,高的收录量只能作为一个变量影响网站的权重,却不能决定一个网站的权重。

  搜索引擎算法,包括它的排名,都是建立在"公正,公平"的基础之上的,就算是百度也是一样,哪怕百度已经开始走向排名商业化运作的道路。高收录量,是搜索引擎对网站的一种认可,我认为对网站的排名结果,没有太大的影响。

影响搜索排名的主要因素

  这里我要说明的是我个人的观点,当然,提出这种观点是有一定的数据依据,但我所依据的数据量还不足以证明我的观点,所以在这里,我只是与大家一起分享我的一些想法。当然这些想法,我会利用时间逐步的进行论证和完善。

页面内容

  影响网站排名的最重要的因素,我认为不是网站关键词,title或者其他的什么因素。而是内容,网站内容,或者说是网站页面的内容。

我之所以,持这种观点,是因为搜索引擎的本质,而它的本质也就是文件检索功能。决定了只要页面中的内容符合搜索关键词,哪怕是title、keywords、description等条件中没有出现关键词,搜索引擎也会将其放入到排名结果中。事实上,keywords、description等条件,在1996年法国巴黎召开的word wide web会议发布HIML3.0代码之前并不存在。有兴趣的seo爱好者可以通过搜索比对发现。当然随着网页编写技术的不断升级,当前没有title这些因素的的网页,就算页面内容中出现了关键词,他的排名结果,也不具备竞争优势,这是由于网页制作技术不断升级造成的。我之所以说明这点,就是为了要让浏览者清楚,影响搜索排名的根本因素。

页面标题(title)

Title的作用,相信大多数的浏览者,都非常清楚。在这里我只做简短的说明。title最初的作用,是对页面内容的简短概括,一般是文章的标题。但随着搜索技术的不断升级和更新,title逐渐转变为页面内容的高度概括和总结,并逐渐的采用关键词作为title主要表现形式,以突出页面信息的主体内容和方便搜索引擎的识别和抓取。
搜索引擎排名计算上,对title主要看中的是是否出现关键词,关键词的位置,及相似关键词出现的比例,以上三点将直接影响title在搜索引擎中的表现。

关键词(keywords

如果说title是对页面内容的高度概括和总结,那么关键词(keywords)就是对页面内容的补充概括,或者说是补充说明,内容关联度的解释。

关键词(keywords)的作用就是利用短语或词组的形式体现页面的主要内容,并根据页面内容进行相关性的表述,使搜索引擎能够快速准确的识别页面的内容。搜索引擎将根据页面关键词的前后排列顺序,页面建设者人为的关键词侧重和页面内容的关键词比率,建立搜索引擎的关键词索引目录。而搜索引擎将根据索引目录的内容进行关键词搜索结果的排序。

影响关键词索引目录的几个主要因素

关键词的位置

搜索引擎认为,关键词的位置越靠前,越能够表现给页面的主题内容。所以在越靠前的关键词,在索引目录中,获得的权重越高。当然,前提是此关键词确实符合页面内容,并能够通过内容中高关键词出现的比率得到搜索引擎的认可。

关键词页面内容中出现的比率

页面中,关键词的出现比率,决定了搜索引擎对关键词的权重分配,高比率的关键词能够得到较好的索引目录的权重。

关键词在title中的表现

就像上面说到的,title中关键词的位置,同样也决定了搜索引擎对关键词的侧重,并通过内容的比对,安排索引目录。

链接文字中的关键词

搜索引擎认为,链接中出现的关键词,能够更好的体现链接内容。所以当前主流的搜索引擎,对链接都是非常重视。能够在链接文字中自然的体现关键词,是博得搜索引擎好感,增加索引中权重的好方法。

图片中的相关设置

图片中的alt,图片的文件名等,虽然当前的搜索技术还无法有效地判断图片的内容,但,搜索引擎对于图片的相关设置还是相等的重视,这一点同网络上的一些说法完全相同,所以,有效地图片设置上的优化,虽然看不到具体的效果,但还是可以影响到网站的总体效果。

标签中的内容

这里所要说的内容同网络上众多高手所说的一样,熟练的使用标签及字体方面的设置,是一种很好的表现手法,尽管许多人看不起这一小小的改动,但细节往往决定结果。

栏目的设置

很重要,当前很多网站的栏目标题,往往是制作人员或是策划人员,随意的根据内容设定的。这点上,完全背离了seo优化的目的,也忘记了搜索引擎设计及抓取的初衷。

栏目标题的设置,再搜索引擎看来,其实就是相当于栏目链接页面的tetle,草率的栏目标题设置,在一定程度上会影响网站的总体效果。

详细的搜索引擎抓取,计算,排名等流程

抓取

熟悉搜索引擎的人都清楚地知道,搜索引擎是通过机器人,或者说是蜘蛛爬虫,对网络上的网页进行检索和抓取。蜘蛛爬虫会将页面信息转换成为代码信息,发送到存储服务器中。

存储服务器的分析计算

存储服务器会将蜘蛛爬虫发送过来的网页进行压缩,并对网页的url等信息进行分析记录下网页的长度,大小,url,url长度,网页内容等信息,最终会分配给该网页一个docID(文档号)。

索引目录的生成

索引器(Indexer)将从存储服务器中调取页面信息,将读取的数据解压缩后进行分析,它将网页中每个有意义的词进行统计后,转化为关键词(wordID)的若干索引项,生成索引项列表,该列表包括关键词、关键词的位置、关键词的大小和大小写状态等。

索引器除了对网页中有意义的词进行分析外,还分析网页的所有超文本链接,将其Anchor Text、URL指向等关键信息存入到Anchor文档库中。

搜索结果的排名

其实就是关键词索引项比对结果的排名。

由于接触seo工作的时间并不是很长,这里只是我的一些观点,可能文章中某些观点并不正确,还请个位朋友帮忙指正。使徒在这里谢谢个位了!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: