您的位置：首页 > 其它

一些网页内容分析时的处理

2010-12-06 11:03 323 查看

string herf = htmltable.GetElementsByTagName("tr")[i].GetElementsByTagName("td")[0].GetElementsByTagName("a")[0].GetAttribute("href");

webBrowser.Document.GetElementsByTagName("div")[i].GetAttribute("className")
取出该类的名字

网页处理有时会因js带来阻碍,所以删除JS成为处理的前提

content= Regex.Replace(content, "<script(.*?)/script>", "");  去除JS
content = Regex.Replace(content, "<!--(.*?)-->", ""); 去除影响显示的代码

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航