您的位置:首页 > 其它

采集系统万能正则表达式

2007-11-30 13:54 204 查看
由于经常要写一些采集的程序,下面的三个函数是采集中的很常用的函数。姑且叫采集系统万能正则表达式吧。全部源码见
http://www.softbk.com/news.asp?id=3564

欢迎一起交流

//获取页面的html源码
public string GetHtmlSource(string Url, string charset)
public string SniffwebCode(string code, string wordsBegin, string wordsEnd)
public ArrayList SniffwebCodeReturnList(string code, string wordsBegin, string wordsEnd)
ArrayList urlList = new ArrayList();
//string NewsTitle = "";
Regex regex1 = new Regex("" + wordsBegin + @"(?<title>[\s\S]+?)" + wordsEnd + "", RegexOptions.Compiled | RegexOptions.IgnoreCase);
for (Match match1 = regex1.Match(code); match1.Success; match1 = match1.NextMatch())
urlList.Add(match1.Groups["title"].ToString());
}
return urlList;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: