防止抓取页面的数据
2015-11-13 18:20
253 查看
从程序上
1、判断用户代理
2、判断ip的访问速度、或者sessionid的访问速度
3、判断请求来源及上级来源
4、客户端通过js自动生成cookie(时间戳和session的加密),后台判断
5、验证码
6、多次不同session判断
从页面上
1、数据随机排序
2、标签中加入随机字符
3、加入随机注释的标签打乱页面组合,加大抓取难度
总之尽量不要有规律。
----未完待续----
1、判断用户代理
2、判断ip的访问速度、或者sessionid的访问速度
3、判断请求来源及上级来源
4、客户端通过js自动生成cookie(时间戳和session的加密),后台判断
5、验证码
6、多次不同session判断
从页面上
1、数据随机排序
2、标签中加入随机字符
3、加入随机注释的标签打乱页面组合,加大抓取难度
总之尽量不要有规律。
----未完待续----
相关文章推荐
- 【leetcode】【62】Unique Paths
- 【Baidu地图学习笔记】Couldn't load BaiduMapSDK_v3_2_0_15: findLibrary returned null
- mongodb sharding原理分析
- 基于java自身技术实现消息方式的系统间通信
- 基于java自身技术实现消息方式的系统间通信
- 计算器
- HTML5 中的事件监听
- Golang Log 学习笔记
- 如何在人工智能机器人领域应用大数据?
- oracle不用tsname文件的时候着怎么办
- JS中的闭包
- iOS事件处理系列1-事件的种类与处理流程
- 【cocos2dx】改安装包名、app名、图标、包名
- poj 3187 Backward Digit Sums 【全排列变形题】
- UIImage、UIData之间转换、跨平台TCP传输
- 源码安装mysql5.5.37
- github优秀前端项目分享(转)
- bzoj3689 luogu p1337
- 【转】C#类似Jquery的html解析类HtmlAgilityPack基础类介绍及运用
- Unity3d 鼠标拣选小功能集合