您的位置:首页 > 运维架构 > 网站架构

YY6359:网站百度不收录情况解析

2010-11-12 08:35 288 查看
网站百度不收录情况解析

一、蜘蛛为什么要不停的爬,不断地更新?

①抓取页面

②页面解析

③提取网页中所有链接

④判断内链和外链

⑤引入当前列表——对比

网站更新机制——蜘蛛会看到新的文章

网站的结构会内链

⑥抓取并放出页面

二、搜索引擎如何安排蜘蛛进行网站搜索?

百度原因

①堆砌关键词

②链接诱饵

③对敏感领域的调整

④百度观察期

三、百度不收录情况解析

搜索引擎遇到 多域名单IP 或是 多域名多IP时 会怎么办?网站本身

3.1框架 搜索引擎很难识别多层嵌套网页

3.2图片多,文字少 导致近似度高 ALT适当设置不相同

3.3过于频繁的提交让搜索引擎误认为此站不稳定

3.4页面静态化有利于搜索引擎爬取。

3.5内链。锚文本的精确度及所在位置(具体设置查看 “关键词权重所在”文章3.6网站服务器不稳定或被攻击

3.7索引robots(是否屏蔽搜索引擎)

3.8网站结构/目录——内容

a:目录不要过深 b:点评(扁平)式网状结构

3.9原创性,质量度 丰富性

本文来自东莞尼嘉斯机械:http://www.xieguang133.com/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: