您的位置:首页 > 编程语言 > Python开发

python爬虫 第2天 开始采集

2018-02-09 15:40 281 查看
使用网络爬虫的 时候,你必须非常谨慎地考虑需要消耗多少网络流量,还要尽力思考能不能让采集目标的 服务器负载更低一些

遍历单个域名

采集整个网站何时有益处,何时有害处
1 生成网站地图 

2 收集数据 
3 链接去重
  python的递归的次数有限制

收集整个网站的数据

通过互联网采集
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: