剔除HTML文档的HTML标记,转换为纯文本
2005-03-10 18:32
453 查看
将文章用文本格式保存,而不是直接使用HTML存储,这样的话会节约数据库空间.
于是写了这么个函数来将文本中的HTML标记剔除
函数虽然简单,但是对处理HTML文档还是很有效的
<%
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
'取闭合的<>
objRegExp.Pattern = "<.+?>"
'进行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍历匹配集合,并替换掉匹配的项目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
%>
于是写了这么个函数来将文本中的HTML标记剔除
函数虽然简单,但是对处理HTML文档还是很有效的
<%
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
'取闭合的<>
objRegExp.Pattern = "<.+?>"
'进行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍历匹配集合,并替换掉匹配的项目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
%>
相关文章推荐
- 用正则表达式剔除文本中的HTML标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 用正则表达式剔除文本里面HTML标记
- [原创代码]用正则表达式剔除文本中的HTML标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- C#将HTML文本转换为普通文本,去掉所有的Html标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 如何使用PHP来快速将纯ASCII文本完美地转换成为可读的HTML标记
- HTML基础知识一(HTML、常见方式、文档结构、<meta>、 网站文件命名、文本修饰、文本样式、段落标记、居中标记、水平线标记、特殊字符、列表、图像)
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- CSS学习笔记一&二:HTML标记与文档结构 字体和文本
- html及css学习笔记_3_html文档格式标记与文本标记
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记(转)
- 用正则表达式剔除文本中的HTML标记
- 源码变换 超文本标记语言(即HTML),是用于描述网页文档的一种标记语言。 HTML通过文本来描述文档显示出来应该具有的“样子”。它主要通过标签来定义对象的显示属性或行为。
- 用正则表达式剔除文本中的HTML标记
- [转贴】如何将HTML标记去除,保留有用的文本
- 解决itext-rtf.jar 对html转换后生成rtf文档 其中表格行列合并的问题
- HTML基础学习-2-文本标记学习
- JAVA:借用OpenOffice将上传的Word文档转换成Html格式