Jsoup中getElementsByClass中className有空格处理
2015-10-11 13:49
489 查看
今天在做网络爬虫的作业是,用jsoup解析html网页时要获得一个class为ep-time-soure cDGray的div的内容。发现doc.getElementsByClass("ep-time-soure cDGray")取值为空。很郁闷,结果查了一圈资料。知道了有空格是表示这个div继承了两个class。
有两种解决方法。1.如果里面有一个class在网页中是唯一的,那么直接doc.getElementsByClass("ep-time-soure")。因为我发现cDGray好像表示的是字体颜色。2.嵌套调用doc.select(".ep-time-soure").select(".cDGray")。我使用的是前面的一个方法,后面的方法是搜索得到的。
有两种解决方法。1.如果里面有一个class在网页中是唯一的,那么直接doc.getElementsByClass("ep-time-soure")。因为我发现cDGray好像表示的是字体颜色。2.嵌套调用doc.select(".ep-time-soure").select(".cDGray")。我使用的是前面的一个方法,后面的方法是搜索得到的。
相关文章推荐
- W3C api 抓取
- 在Windows 8.1的IE 11中屏蔽双击放大功能
- 我投了份简历,接到了十八个骚扰电话
- 通过Mootools 1.2来操纵HTML DOM元素
- WEB标准网页布局中尽量不要使用的HTML标签
- Flash 与 html 的一些实用技巧
- html工作中表格<tbody>标签的使用技巧
- HTML 向 XHTML1.0 兼容性指导
- C#自写的一个HTML解析类(类似XElement语法)
- 没有文件大小限制并免费的PDF到HTML转换工具
- css实现气泡框效果(实例加图解)
- html链接与文本标签们
- html活用软字符连接符
- 浅谈html中id和name的区别实例代码
- HTML <!DOCTYPE> 标签
- asp中实现清除html的函数
- Android的TextView与Html相结合的具体方法
- jQuery设置和获取HTML、文本和值示例
- 『jQuery』.html(),.text()和.val()的概述及使用