您的位置：首页 > Web前端 > HTML

剔除HTML文档的HTML标记，转换为纯文本

2005-03-10 18:32 453 查看

将文章用文本格式保存，而不是直接使用HTML存储，这样的话会节约数据库空间．

于是写了这么个函数来将文本中的HTML标记剔除

函数虽然简单，但是对处理HTML文档还是很有效的

<%

Function RemoveHTML(strHTML)

Dim objRegExp, Match, Matches

Set objRegExp = New Regexp



objRegExp.IgnoreCase = True

objRegExp.Global = True

'取闭合的<>

objRegExp.Pattern = "<.+?>"

'进行匹配

Set Matches = objRegExp.Execute(strHTML)



' 遍历匹配集合，并替换掉匹配的项目

For Each Match in Matches

     strHtml=Replace(strHTML,Match.Value,"")

Next

RemoveHTML=strHTML

Set objRegExp = Nothing

End Function

%>

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

用正则表达式剔除文本中的HTML标记
使用C#将HTML文本转换为普通文本，去掉所有的Html标记
用正则表达式剔除文本里面HTML标记
[原创代码]用正则表达式剔除文本中的HTML标记
使用C#将HTML文本转换为普通文本，去掉所有的Html标记
C#将HTML文本转换为普通文本，去掉所有的Html标记
使用C#将HTML文本转换为普通文本，去掉所有的Html标记
如何使用PHP来快速将纯ASCII文本完美地转换成为可读的HTML标记
HTML基础知识一（HTML、常见方式、文档结构、<meta>、网站文件命名、文本修饰、文本样式、段落标记、居中标记、水平线标记、特殊字符、列表、图像）
使用C#将HTML文本转换为普通文本，去掉所有的Html标记
CSS学习笔记一&二：HTML标记与文档结构字体和文本
html及css学习笔记_3_html文档格式标记与文本标记
使用C#将HTML文本转换为普通文本，去掉所有的Html标记(转)
用正则表达式剔除文本中的HTML标记
源码变换超文本标记语言（即HTML），是用于描述网页文档的一种标记语言。 HTML通过文本来描述文档显示出来应该具有的“样子”。它主要通过标签来定义对象的显示属性或行为。
用正则表达式剔除文本中的HTML标记
[转贴】如何将HTML标记去除，保留有用的文本
解决itext-rtf.jar 对html转换后生成rtf文档其中表格行列合并的问题
HTML基础学习-2-文本标记学习
JAVA：借用OpenOffice将上传的Word文档转换成Html格式

新的分享

Html简单标签
HTML表单
仿京东商城html网页源码
HTML行内级元素之间的空格问题
HTML元素类型总结
HTML怎么设置下划线?html文字加下划线方法
HTML汉字编码标准介绍
html网页中使用希腊字母的方法
HTML基础详解(上)
HTML基础详解（下）
基于HTML十秒做出淘宝页面
【Python】300行代码搞定HTML模板渲染

章节导航