C#获取远程网页中的所有链接URL
2012-06-17 08:15
399 查看
using System; using System.Net; using System.Text; using System.Text.RegularExpressions; namespace HttpGet { class Class1 { [STAThread] static void Main(string[] args) { System.Net.WebClient client = new WebClient(); byte[] page = client.DownloadData("http://news.163.com"); string content = System.Text.Encoding.UTF8.GetString(page); string regex = "href=[\\\"\\\'](http:\\/\\/|\\.\\/|\\/)?\\w+(\\.\\w+)*(\\/\\w+(\\.\\w+)?)*(\\/|\\?\\w*=\\w*(&\\w*=\\w*)*)?[\\\"\\\']"; Regex re = new Regex(regex); MatchCollection matches = re.Matches(content); System.Collections.IEnumerator enu = matches.GetEnumerator(); while (enu.MoveNext() && enu.Current != null) { Match match = (Match)(enu.Current); Console.Write(match.Value + "\r\n"); } } } }
相关文章推荐
- C#获取远程网页中的所有链接URL
- C#获取远程网页中的所有链接URL
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- c#获取远程网页链接
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- Java正则表达式获取网页所有网址和链接文字
- C# 网络编程之webBrowser获取网页url和下载网页中图片
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- 如何获取网页中所有的链接
- python获取网页上所有链接
- 一条JavaScript语句获取当前网页所有图片的url
- 获取网页URL地址及参数等的两种方法(js和C#)
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- delphi 获取网页所有链接并访问赚取金币
- C# 网络编程之webBrowser获取网页url和下载网页中图片