您的位置:首页 > 理论基础 > 计算机网络

Server returned HTTP response code: 403 for URL: http://blog.csdn.net

2014-11-01 21:38 309 查看
在使用Jsoup抓取CSDN博客数据时候报http403错误,这是由于CSDN博客服务器设置了访问权限

如果是服务器端禁止抓取,那么这个你可以通过设置User-Agent来欺骗服务器

connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");

利用这个原理,Jsoup代码稍作调整即可:

Connection connection =
Jsoup.connect(url);

connection.userAgent("Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");

Document doc = connection.get();
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐