jsoup获取html页面中的内容
2016-12-26 17:58
253 查看
当我想要获取<a sf="pagebar" sf:data="({pg:1,ps:1000,tt:9091,pn:5,pc:10,id:'',st:true})"></a>这行数据时,按平常的doc.select(".clearfix").get(2)是行不通的,需要换一种写法:
Elements item=doc.select("a[sf=pagebar]");
String data=item.attr("sf:data");
JSONObject json=JSONObject.parseObject(data.substring(1,data.length()-1));
int tt=json.getIntValue("tt");
int ps=json.getIntValue("ps");
想要获取script标签里的数据时:
Element item=doc.select(".clearfix").get(2);
Elements eles = item.getElementsByTag("script");
for (Element ele : eles) { // 檢查是否有$total字串
String script = ele.toString();
if (script.indexOf("$total") > -1) {
script = ele.childNode(0).toString(); // 只取得script的內容
String countPage=script.substring(script.indexOf("$total")+8,script.indexOf("$reload")-2);
}
}
相关文章推荐
- 利用webBrowser获取框架内Html页面内容
- 利用webBrowser获取框架内Html页面内容
- Java后台去除前台传递数据中的页面标签(HTML,Javascript,Style),获取文本内容!
- 在html中,怎么获取当前页面body的高度,body是没有设置高度的,但是里面有内容
- 动态获取html页面的内容,并且取其中的某块元素的方法
- 获取Html页面元素属性内容
- 利用webBrowser获取框架内Html页面内容
- 使用jsoup解析html页面内容案例
- java-jsoup解析html页面的内容
- Android ios获取html页面的标签内容
- 获取html页面全部标签或者标签内容
- java-jsoup解析html页面的内容
- 2013-6-28-2-服务端获取客户端html页面内容
- 从html页面获取纯文本文件替换其中的内容
- (转)获取HTML页面内容后格式化显示的办法
- 服务端获取客户端html页面内容-2013-6-28-2
- 获取html页面内容
- 获取WebView加载HTML时网页中的内容 获取页面元素
- JS获取html页面上选中内容
- 动态获取html页面的内容,并且取其中的某块元素的方法