清除HtmlAgilityPack得到的InnerText中残留的script
2015-08-27 10:50
741 查看
清除脚本可以这样:
清除样式可以这样:
清除多行注释,类似下面的:
可以像下面那样清除:
解释:HtmlAgilityPack是使用XPath语法,"//comment()"在XPath中表示“所有注释节点”,关于XPath的详细用法请参考XPath的资料。
foreach(var script in doc.DocumentNode.Descendants("script").ToArray()) script.Remove();
清除样式可以这样:
foreach(var style in doc.DocumentNode.Descendants("style").ToArray()) style.Remove();
清除多行注释,类似下面的:
<!--[if IE]> <script language="JavaScript"> var objmain = document.getElementById("main"); function updatesize(){ var bodyw = window.document.body.offsetWidth; var w=(bodyw<=790?"790px":"100%"); objmain.style.width=w; } updatesize(); window.onresize = updatesize; </script> <![endif]-->
可以像下面那样清除:
foreach (var comment in doc.DocumentNode.SelectNodes("//comment()").ToArray()) comment.Remove();
解释:HtmlAgilityPack是使用XPath语法,"//comment()"在XPath中表示“所有注释节点”,关于XPath的详细用法请参考XPath的资料。
相关文章推荐
- HTML常用标签及其全称
- html页面中竟然出现这么奇怪的东西
- HTML特殊字符编码大全
- 最简单的html轮播图制作适合新手
- html 利用 frameset 进行简单的框架布局
- pdf2htmlEX将pdf文件转化为html最优参数以及把生成文件等比例缩小
- HTML 5 <input> placeholder 属性
- HTML 5 <input> placeholder 属性
- HTML 5 <input> placeholder 属性
- HTML meta refresh 刷新与跳转(重定向)页面
- HTML 5 canvas globalCompositeOperation 属性
- 动态绑定HTML
- HTML中Id和Name的区别
- HTML中rel属性分析
- html的表结构
- html随笔
- HTML 1
- HTML语法基础
- pdf转换成html的方法介绍
- Html 中的DOM