百度搜索结果URL解密
2013-06-28 10:10
369 查看
由于公司在做搜索引擎的爬虫,在抓取百度的搜索结果时候发现百度搜索出的结果URL都是经过加密的,研究了好几天终于让我把原始的URL地址获取到了,
String str="http://www.baidu.com/link?url=ocBgaAqTL-bjTziI90PO454UZ3r3o31RCNp7h4XvKjT_cjBzfYx25CLrIsYsmFFx";
URL url = new URL(str);
HttpURLConnection conn=(HttpURLConnection)url.openConnection();
conn.getResponseCode();
String realUrl=conn.getURL().toString();
conn.disconnect();
System.out.println("真实URL:"+realUrl);
String str="http://www.baidu.com/link?url=ocBgaAqTL-bjTziI90PO454UZ3r3o31RCNp7h4XvKjT_cjBzfYx25CLrIsYsmFFx";
URL url = new URL(str);
HttpURLConnection conn=(HttpURLConnection)url.openConnection();
conn.getResponseCode();
String realUrl=conn.getURL().toString();
conn.disconnect();
System.out.println("真实URL:"+realUrl);
相关文章推荐
- 发布我的第一个Chrome扩展:移除百度搜索结果链接的跳转,去除恶心的/link?url=xxxxxxx....
- 使用BeautifulSoup爬虫程序获取百度搜索结果的标题和url示例
- python3爬取百度搜索结果url,获得真实url,提取网页正文并分词,多进程的使用
- JAVA析取百度搜索前100个结果的URL、标题和摘要
- 百度搜索结果的URL参数 首页类型(rsv_spt)
- 百度搜索结果大变脸:去除URL后缀,分享彻底删除
- 获取百度搜索结果的真实url以及摘要和时间
- 百度搜索结果的URL参数_反馈搜索结果用时(rsv_sug4)
- 百度搜索结果的URL参数 搜索历史记录(rsv_sug)
- 解析百度搜索结果link?url=参数分析 (全)
- 百度搜索结果的URL参数 搜索框位置(rsv_bp)
- python如何获取百度搜索结果的真实URL
- 解析百度搜索结果link?url=参数分析 (全)
- 解析百度搜索结果链接的url,获取真正的url
- 百度搜索结果URL参数含义解析
- 百度搜索结果中link?url 格式的真实地址获取方式
- 抓取百度搜索结果——解密百度狗
- 百度搜索结果的URL参数 提示词输入搜索框方式(rsv_sug5)
- 百度搜索结果的URL参数 其他输入搜索词方式(rsv_n)