过滤掉html文件中标签的一个类文件
2009-02-16 13:59
281 查看
package han.other;
import java.lang.*;
import java.util.*;
import java.util.regex.*;
public class FilterTags {
public FilterTags() {
}
public String getFilterTags(String imputString) {
String htmlStr = imputString;
String textStr = '';
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
String regEx_script = '<[//s]*?script[^>]*?>[//s//S]*?<[//s]*?///[//s]*?script[//s]*?>'; // 定义script的正则表达式{或]*?>[//s//S]*?<///script>
String regEx_style = '<[//s]*?style[^>]*?>[//s//S]*?<[//s]*?///[//s]*?style[//s]*?>'; // 定义style的正则表达式{或]*?>[//s//S]*?<///style>
String regEx_html = '<[^>]+>'; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(''); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(''); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(''); // 过滤html标签
textStr = htmlStr;
} catch (Exception ex) {
ex.printStackTrace();
}
return textStr;
}
}
import java.lang.*;
import java.util.*;
import java.util.regex.*;
public class FilterTags {
public FilterTags() {
}
public String getFilterTags(String imputString) {
String htmlStr = imputString;
String textStr = '';
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
String regEx_script = '<[//s]*?script[^>]*?>[//s//S]*?<[//s]*?///[//s]*?script[//s]*?>'; // 定义script的正则表达式{或]*?>[//s//S]*?<///script>
String regEx_style = '<[//s]*?style[^>]*?>[//s//S]*?<[//s]*?///[//s]*?style[//s]*?>'; // 定义style的正则表达式{或]*?>[//s//S]*?<///style>
String regEx_html = '<[^>]+>'; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(''); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(''); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(''); // 过滤html标签
textStr = htmlStr;
} catch (Exception ex) {
ex.printStackTrace();
}
return textStr;
}
}
相关文章推荐
- Java 过滤所有html标签,复制文件到指定位置
- C#替换html代码中所有img标签的路径保留文件名称
- asp.net过滤HTML标签的几个函数
- 过滤HTML以及CSS样式等标签
- java web过滤器实际应用(解决中文乱码 html标签转义功能 敏感字符过滤功能)
- web.xml文件中的jsp-config标签详解 --可用于解决jsp、html乱码问题
- 过滤HTML标签
- java过滤html标签
- 关于Android中如何过滤HTML标签
- 正则表达式过滤html标签
- js过滤HTML标签完整实例
- html标签过滤
- 过滤eWebeditor等富文本中html标签,获得纯文本信息
- 过滤html标签 RemoveHTML(string html)
- DEDE中如何过滤掉Html标签,并且截取字符串长度
- 用正则表达式过滤html页面中的标签
- Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法(本文由169it.com搜集整理)
- asp.net过滤HTML标签的几个函数
- jquery过滤HTML标签方法
- php完全过滤HTML,JS,CSS等标签