您的位置:首页 > 其它

一些网页内容分析时的处理

2010-12-06 11:03 323 查看
string herf = htmltable.GetElementsByTagName("tr")[i].GetElementsByTagName("td")[0].GetElementsByTagName("a")[0].GetAttribute("href");

webBrowser.Document.GetElementsByTagName("div")[i].GetAttribute("className")
取出该类的名字

网页处理有时会因js带来阻碍,所以删除JS成为处理的前提

content= Regex.Replace(content, "<script(.*?)/script>", "");  去除JS
content = Regex.Replace(content, "<!--(.*?)-->", ""); 去除影响显示的代码
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: