您的位置:首页 > 运维架构 > 网站架构

怎么做网站XML地图讲解

2016-09-02 11:51 260 查看
  网站地图一般有两种形式,第一种形式是HTML,主要针对用户方便浏览和查询网站信息;第二种形式则是XML版本的网站地图。英文Sitemap中的S大写时通常特指XML网站地图。XML版本网站地图由XML标签组成,文件本身必须是utf编码。

  XML网站地图由Google于2005年首先提出,2006年微软、雅虎都宣布支持。2007年各主要搜索引擎都开始支持:robots文件指定网站地图位置。百度现在也支持X_N4L版本网站地图。

  网站地图文件实际上就是列出网站需要被收录的页面URL。最简单的网站地图可以是一个纯文本文件,文件只要列出页面URL,一行列一个URL,搜索引擎就能抓取并理解文件内容。

标准版本的XML网站地图文件如下列代码所示:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
  <url>
    <loc>http://www.example.Com/</loc>
    <lastmod>2010-01-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0. 8</priority>
  </url>
</urlset>


  这是标准的xml语法, 指url集 ,里面的每个标记,就是一个页面地址

  在这里填写你要提交的页面的完整地址

  这里面填写该页面的最后更新时间

  这里面填写该页面的更新频率

  这里面填写该页面对于整站的权重

  当然,如果你实在不想写,你可以不写changefreq 和 priority

  其中 urlset 标签是必需的,声明文档所使用的Sitemap协议版本。

  url 标签也是必需的,是它下面所有网址的母标签。

  loc 标签也是必需的,这一行列出的就是页面完整URl.

  lastmod 是可选标签,表示页面最后一次更新时间。

  changefreg 是可选标签,代表文件更新频率。标签值包括:

   ·always,一直变动,指的是每次访问页面内容都不同。

   ·hourly,每小时。

   ·daily,每天。

   ·weekly,每星期。

   ·monthly,每月。

   ·yearly,每年。

   ·never,从不改变。

  网站地图中声明的更新频率对搜索引擎来说只是一个提示,供搜索引擎蜘蛛参考,但搜索引擎不一定真的认为页面更新频率就是站长自己声明的那样。

   priority是可选标签,表示URL的相对重要程度。可选0.0到1.0之间的数值,1.0为最重要,0.0为最不重要。默认重要程度值为0.5。 站长可以使用priority标签告诉搜索引擎这个URL的优先级,比如通常首页肯定是1.0,分类页面可能是0.8,其他更深层页面重要性依次下降。这 里所标志的重要程度只是相对于这个网站内部的URL所说的,与其他网站的URL重要性无关。所以把页面重要性标为1.0,并不能让搜索引擎认为这个页面比 其他网站的页面更重要,只是告诉搜索引擎这个页面在本网站内是最重要的。

  XML网站地图文件最多可以列出5万个URL,文件不能超过10MB。如果网站需要收录的URL超过5万个,可以使用网站地图索引文件,也就是分成多个网站地图文件。一个网站最多可以有1000个XML网站地图文件,也就是可以列出5000万个网址。

  制作好网站地图文件后,可以有两种方式通知搜索引擎网站地图的位置,一是在站长工具后台提交网站地图文件。另外一种方式是在robots.txt文件中通知搜索引擎网站地图文件位置,代码如下所示:

  Sitemap: http://www.example.com/sitemap.xml

  所有主流搜索引擎,包括百度、Google、雅虎、必应,都支持robots文件指定网站地图文件位置。

  通过XML网站地图通知搜索引擎要收录的页面,只能让搜索引擎知道这些页面的存在,并不能保证一定被收录,搜索引擎还要看这些页面的权重是台达到收录的最低标准。以XML网站地图只是辅助方法,不能代替良好的网站结构。

  大中型网站提交网站地图通常有比较好的效果,能使收录增长不少。但也有的网站,尤其是小型网站,提交XML网站地图没有什么效果,有的站长甚至认为有反效果。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  xml 地图 搜索引擎