您的位置:首页 > Web前端 > JavaScript

Jsoup中getElementsByClass中className有空格处理

2015-10-11 13:49 489 查看
今天在做网络爬虫的作业是,用jsoup解析html网页时要获得一个class为ep-time-soure cDGray的div的内容。发现doc.getElementsByClass("ep-time-soure cDGray")取值为空。很郁闷,结果查了一圈资料。知道了有空格是表示这个div继承了两个class。

有两种解决方法。1.如果里面有一个class在网页中是唯一的,那么直接doc.getElementsByClass("ep-time-soure")。因为我发现cDGray好像表示的是字体颜色。2.嵌套调用doc.select(".ep-time-soure").select(".cDGray")。我使用的是前面的一个方法,后面的方法是搜索得到的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  html 网络爬虫 jsoup