jsoup去掉标签中的标签,保留非标签内容
2013-11-28 18:08
357 查看
通过jsoup的select这一获取标签<b
id="d_price" class="d_price "><span
class="yen">¥</span>414.50</b>
现在的问题是,我只想提取414.50这个价格而不要span标签及里面的内容。
我的解决方法时:
//通过jsoup中select选择b标签,在获取html内容
String htmlContent = "<span class=\"yen\">¥</span>414.50";
System.out.println(htmlContent);
//去除标签内容
htmlContent = htmlContent.replaceAll("<.*>.*</[\\w-\\W-]*>", "");
System.out.println("过滤后:"+htmlContent);
其实这个问题解决方法很多,你可以选获取b标签
Element b = XXX.select("b#d_price
");
在删除b标签中的span标签: b.remove("span");但是这个方法在上面不适用,因为我选择器中的正则表达式是动态读取的,那么你处理的时候就不知道获取后的Element中包含的标签是什么标签了;所以之恩能够获取Element的html内容,然后用正则表达式去掉你们的<...>XXX</...>标签。
id="d_price" class="d_price "><span
class="yen">¥</span>414.50</b>
现在的问题是,我只想提取414.50这个价格而不要span标签及里面的内容。
我的解决方法时:
//通过jsoup中select选择b标签,在获取html内容
String htmlContent = "<span class=\"yen\">¥</span>414.50";
System.out.println(htmlContent);
//去除标签内容
htmlContent = htmlContent.replaceAll("<.*>.*</[\\w-\\W-]*>", "");
System.out.println("过滤后:"+htmlContent);
其实这个问题解决方法很多,你可以选获取b标签
Element b = XXX.select("b#d_price
");
在删除b标签中的span标签: b.remove("span");但是这个方法在上面不适用,因为我选择器中的正则表达式是动态读取的,那么你处理的时候就不知道获取后的Element中包含的标签是什么标签了;所以之恩能够获取Element的html内容,然后用正则表达式去掉你们的<...>XXX</...>标签。
相关文章推荐
- 如何去掉 a标签内的span标签 并且保留span内的内容
- 如何去掉 a标签内的span标签 并且保留span内的内容
- xml文件去掉所有标签只保留内容部分
- dede数据库内容替换,去掉文章内容中的img标签
- Sql Server 如何去掉内容里面的Html标签
- js去掉html标签只去文字内容
- jquery删除指定的html标签并保留标签内文本内容的方法
- js正则过滤span标签中不包含datatype属性的所有span,仅保留内容
- 如何删除一个标签,但是保留里面的内容?
- jQuery去掉指定标签里所有文字内容对应的链接,==去掉<a>标签
- 如何使用jQuery去掉指定标签里所有文字内容对应的链接,即去掉<a>标签
- Golang 页面模板之模板中如何插入数据,输出嵌套字段内容?以及神奇的减号“-”,如何去掉Go Template生成的标签换行符
- POI按行读取word,并去掉属性标签内容:超链接
- 去掉内容中的所有全部html标签
- 去掉html标签与标签之间的空格以及标签和内容之间的空格
- 去掉内容里的HTML标签属性
- 通过js去掉所有的html标签,得到HTML标签中的所有内容 【2018-1-30】
- 删除字符串中所有html标签,保留标签内容
- 去掉内容中的所有html标签
- 获取html字符串中第一张图片的路径以及获取html字符串中的文字内容(去掉标签)