【干货】.NET开发通用组件发布(三) 简易数据采集组件
2014-04-05 01:09
477 查看
组件介绍和合作开发
/article/5311178.html简易数据采集组件
怎么说他是一个简易的数据采集组件呢?因为由于时间仓促,缺少从某位置开始到某位置结束这种模式的采集,暂且叫他简易数据采集组件吧。直接进入主题。
准备
引用:MrHuo.Controls.Gather;测试效果
1、我的测试代码是这样的:using MrHuo.Controls.Gather; using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace ConsoleApplication1 { class Program { static void Main(string[] args) { Gather gather = new Gather() { RegexPattern = @"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>", Url = "http://www.mrhuo.com" }; gather.OnBeginCollect += gather_OnBeginCollect; gather.OnCollecting += gather_OnCollecting; gather.OnEndCollect += gather_OnEndCollect; gather.OnError += gather_OnError; gather.Collect(); Console.ReadLine(); } static void gather_OnError(Exception obj) { Console.WriteLine("采集过程中发生错误:" + obj.Message); } static void gather_OnEndCollect() { Console.WriteLine("采集结束."); } static void gather_OnCollecting(System.Text.RegularExpressions.Match obj) { Console.WriteLine("正在采集:" + obj.Groups["text"].Value + "(" + obj.Groups["url"].Value + ")"); } static void gather_OnBeginCollect() { Console.WriteLine("采集开始..."); } } }
2、采集结果:
![](http://images.cnitblog.com/i/316520/201404/050101225001928.jpg)
3、关于采集过程中为什么不一次性输出结果,暂时没有更好的解决方法,所以暂无提供。
如有好的想法和建议,可以发送电子邮件到:admin@mrhuo.com,参与项目开发。
测试项目下载:
点击下载
相关文章推荐
- 【干货】.NET开发通用组件发布(四) 日志记录组件
- 【干货】.NET开发通用组件发布(一) 介绍
- 【干货】.NET开发通用组件发布(二) 邮件发送组件
- 正在开发一个非.net得数据表格组件,用到.net应用中去……
- Java游戏开发组件LGame简易测试版发布(版本号:0.1.5)
- Java游戏开发组件LGame简易测试版发布(版本号:0.1.0)
- Java游戏开发组件LGame简易测试版发布(版本号:0.2.0)
- .NET-使用NPOI组件将数据导出Excel-通用方法
- Java游戏开发组件LGame简易测试版发布(版本号:0.1.5)
- Java游戏开发组件LGame简易测试版发布(版本号:0.1.0)
- C#.NET 大型通用信息化系统集成快速开发平台 4.1 版本 - .NET商业化成品成熟各种数据权限的需求对应例子代码
- 通用高性能 Windows Socket 组件 HP-Socket v2.2.2 正式发布
- .NET快速信息化h5微信二八杠棋牌房卡网站系统开发搭建框架 V3.0 版本强势发布
- ExtJS与.NET结合开发实例(Grid之数据显示、分页、排序篇)
- 通用数据库开发组件(二)--0517
- 在.net开发中使用Log4Net组件
- iphone开发之用lipo合并模拟器库和真机库,发布一个通用的静态库
- 开发Kafka通用数据平台中间件
- 为贸易局开发的数据采集、统计、管理系统
- 【端午呈献】通用高性能 Windows Socket 组件 HP-Socket v2.2.1 悄然发布