一段消除HTML标签格式的代码
2008-01-30 15:54
323 查看
原创代码,转发者请标明出处,谢谢!
最近工作中间遇到一个问题,oracle的varchar2最大只能到4000,而我们要装入一个超文本的表,结果就把它的源代码给导入了,一下就超了4000,所以需要洗掉里面的格式,只留下基本的HTML的表格相关标签。 我就写了下面小小的一段代码,其实对其他HTML标签也是适用的。
public String replaceHTMLTAG(String s,String itag) {
int i=s.indexOf(itag+" ");
int j;
while(i!=-1){
j=s.indexOf(">",i);
s=s.replaceAll(s.substring(i,j+1),itag+">");
i=s.indexOf(itag+" ");
}
return s;
}
其中第一形参就是送过来的源代码,比如s="<TABLE style='.....'><TH> fasfd</TH><TR><TD>asf</TD></TR></TABLE>";
第二形参就是我们指定要清洗的标签,比如要清除掉TABLE标签的格式等内容,itag="<TABLE";就可以了。
工作匆忙,改进的地方应该不少,只是希望对大家的工作能小小提高下速度。
最近工作中间遇到一个问题,oracle的varchar2最大只能到4000,而我们要装入一个超文本的表,结果就把它的源代码给导入了,一下就超了4000,所以需要洗掉里面的格式,只留下基本的HTML的表格相关标签。 我就写了下面小小的一段代码,其实对其他HTML标签也是适用的。
public String replaceHTMLTAG(String s,String itag) {
int i=s.indexOf(itag+" ");
int j;
while(i!=-1){
j=s.indexOf(">",i);
s=s.replaceAll(s.substring(i,j+1),itag+">");
i=s.indexOf(itag+" ");
}
return s;
}
其中第一形参就是送过来的源代码,比如s="<TABLE style='.....'><TH> fasfd</TH><TR><TD>asf</TD></TR></TABLE>";
第二形参就是我们指定要清洗的标签,比如要清除掉TABLE标签的格式等内容,itag="<TABLE";就可以了。
工作匆忙,改进的地方应该不少,只是希望对大家的工作能小小提高下速度。
相关文章推荐
- 从一段html代码中获取Img标签
- HTML用来显示计算机代码的标签 pre 预定义格式标签
- struts标签消除自定义格式
- Web前端设计:Html强制不换行<nobr>标签用法代码示例
- 如何让HTML标签元素紧挨着(消除元素或标签直接的空白间距)
- 【Html】使用<pre>标签为你的网页加入大段代码
- java从一段html代码中获取图片的路径
- 网页HTML代码中Meta标签详解
- 将html代码中的大写标签转换成小写标签
- 移动前端开发中添加一些webkit专属的HTML5头部标签,帮助浏览器更好解析html代码,更好地将移动web前端页面表现出来。本文整理一些常用的meta标签
- C#去除指定字符串中的HTML标签相关代码函数
- php正则过滤html标签、空格、换行符的代码,提取图片
- HTML 标签格式
- 一段奇怪的HTML代码
- html代码格式严谨
- C#去除一段字符串内的HTML标签,正则表达式
- 消除HTML网页顶部的一行空白方法(火狐显示正常,谷歌head与body之间有未知代码)
- java如何从一段html代码中获取图片的src路径
- 从一段html的table标签中按列提取信息
- php学习基础篇之对HTML页面里标签代码含义的讲解