asp.net 新闻采集 简单示例
2010-11-30 09:35
363 查看
在网上看了点资料,自己整理了一下,我感觉要用的话新闻地址,应该用RSS来配这样好用些,
o(∩_∩)o 哈哈
o(∩_∩)o 哈哈
private void init2(string url,string begin,string end) { HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse(); Stream stream = webResponse.GetResponseStream(); System.IO.StreamReader streamReader = new StreamReader(stream, Encoding.GetEncoding("gb2312")); string content = streamReader.ReadToEnd(); streamReader.Close(); webResponse.Close(); if (content.IndexOf(begin) > 0) content = content.Substring(content.IndexOf(begin)); if (content.IndexOf(end) > 0) content = content.Substring(0, content.IndexOf(end) + end.Length); if (content.IndexOf(begin) < 0 || content.IndexOf(end)<0) { Response.Write("<script>alert('规则定义错误!');</script>"); }else { content = DelHTML(content); txtContent.Text = content; } } public static string DelHTML(string Htmlstring)//将HTML去除 { #region //删除脚本 Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); //删除HTML Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"-->", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<!--.*", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); //Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<A>.*</A>", ""); //Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<[a-zA-Z]*=\.[a-zA-Z]*\?[a-zA-Z]+=\d&\w=%[a-zA-Z]*|[A-Z0-9]", ""); //Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<P>.*</P>", ""); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, " ", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(amp|#38);", "&", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(lt|#60);", "<", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(gt|#62);", ">", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"(\d+);", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase); Htmlstring.Replace("<", ""); Htmlstring.Replace(">", ""); Htmlstring.Replace("\r\n", ""); //Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); #endregion return Htmlstring; }
相关文章推荐
- MSMQ(Microsoft Message Queue,微软消息队列) Asp.Net 简单示例
- ASP.NET 简单的柱形图实现(附带示例)
- 在ASP.NET Atlas中调用Web Service——创建Mashup调用远端Web Service(基础知识以及简单示例)
- [ASP.NET 设计模式] 用Visual Studio2010搭建一个简单的分层结构示例Step by Step —— 01 准备工作
- Asp.Net判断一个字符串是否包含某个字符的最简单方法!(示例)
- MSMQ(Microsoft Message Queue,微软消息队列) Asp.Net 简单示例
- Asp.net 2.0 一个简单的联动DropDownList示例(示例代码下载)
- 使用ASP.Net WebAPI构建REST服务(一)——简单的示例
- Asp.net SignalR 指定用户消息推送简单示例
- asp.net新闻采集(wyz)
- FileUpload上传组件在ASP.net中最简单的运用示例
- Jquery 调用asp.net ajax (web service/static page method)的示例(一)---简单参数
- ASP.NET简单的数据库绑定和LINQ示例
- asp.net WebService的一个简单示例
- MSMQ(Microsoft Message Queue,微软消息队列) Asp.Net 简单示例
- asp.net 生成html 简单示例
- 在ASP.NET Atlas中调用Web Service——创建Mashup调用远端Web Service(基础知识以及简单示例)
- ASP.NET上运行Redis简单示例
- 两个简单的Demo示例向读者展示Flash和ASP.NET交互原理以及过程
- ASP.NET 简单的柱形图实现(附带示例)