为新闻内容截字而写的过滤HTML的C#方法
2009-03-09 10:31
316 查看
好久没分享经历了,今天由于有个项目需要对新闻的内容截字显示,但由于新闻内容里有HTML的标签,如果不过滤掉这些HTML标签,截出来的字可能会产生HTML的烂码。需求如下:
1)将<table>内的所有内容全部过滤掉。
2)将其它的HTML标签过滤掉。
我的实现方法如下:
1)将<table>内的所有内容全部过滤掉。
2)将其它的HTML标签过滤掉。
我的实现方法如下:
public string ClearHtmlTag(string html) { Regex htmlRegex1 = new Regex(@"<table(/s+[^>]+)?>(?![/s/S]*<table(/s+[^>]+)?>)[/s/S]*?</table>", RegexOptions.IgnoreCase); Regex htmlRegex2 = new Regex(@"<(script|style)(/s+[^>]+)?>[/s/S]*?<//1>", RegexOptions.IgnoreCase); Regex htmlRegex3 = new Regex(@"<[^>]*>", RegexOptions.IgnoreCase); html = htmlRegex1.Replace(html, ""); if (htmlRegex1.IsMatch(html)) { html = ClearHtmlTag(html); } else { html = htmlRegex2.Replace(html, ""); html = htmlRegex3.Replace(html, ""); } return html; }
相关文章推荐
- 用C#把HTML内容转为UBB的方法
- C# 将html文本转化为 文本内容方法TextNoHTML
- C# html 标签过滤方法
- C#从剪贴板获取HTML格式内容含中文字符出现的问题和解决方法
- 织梦dedecms网站首页调用单页文档内容并带过滤html的方法
- .net C# 过滤HTML标签的几种方法 精华整理哦
- 网页内容的html标签补全和过滤的两种方法
- C#实现过滤html标签并保留a标签的方法
- C# Winform 中webBrowser显示html内容时禁止错误提示的方法
- Lotusscript代理调用正则表达式过滤掉<html>代码,获取notesRichTextItem内容信息的方法
- DEDECMS首页调用单页文档内容并带过滤HTML的方法
- 过滤HTML标签的方法.C#和JS分别
- C# Winform 中webBrowser显示html内容时禁止错误提示的方法
- 过滤html标签的方法(C#版)---- NOHTML(C#)
- PHP实现网页内容html标签补全和过滤的方法小结【2种方法】
- 织梦DEDECMS首页调用单页文档内容并带过滤HTML的方法
- 网页内容的html标签补全和过滤的两种方法
- JAVA过滤标签实现将html内容转换为文本的方法示例
- C#正则过滤HTML标签并保留指定标签的方法
- C#将内容附带的html标签去掉转成纯文本方法