文章标题
2015-08-18 09:56
330 查看
java 正则实现
去除内容中冗余
获取尖括号内的内容
去除内容中冗余
获取尖括号内的内容
import java.util.regex.Matcher; import java.util.regex.Pattern; public class HTMLSpirit { //保留<body></body>间的内容 public static String delHTMLTag(String htmlStr) { String regEx_be4body = "<html[^>]+>[\\s\\S]*?<body[^>]*?>"; String regEx_aftbody = "<\\/body>[\\s\\S]*?<\\/html>"; //Pattern.CASE_INSENSITIVE 不区分大小写的UNICODE_CASE样式 Pattern p_be4body = Pattern.compile(regEx_be4body,Pattern.CASE_INSENSITIVE); Matcher m_be4body = p_be4body.matcher(htmlStr); htmlStr = m_be4body.replaceAll(""); Pattern p_aftbody = Pattern.compile(regEx_aftbody,Pattern.CASE_INSENSITIVE); Matcher m_aftbody = p_aftbody.matcher(htmlStr); htmlStr = m_aftbody.replaceAll(""); return htmlStr.trim(); } //...<..要取的内容..>... public static String getCleanAddress(String mailAddrs){ StringBuffer addr=new StringBuffer(); Pattern pattern = Pattern.compile("<(.*?)>"); Matcher matcher = pattern.matcher(mailAddrs); if(matcher.find()){ addr.append(matcher.group(1)+";"); return addr.toString(); }else { return mailAddrs; } } }
相关文章推荐
- NYOJ 17 单调递增最长子序列
- 多任务的同步与互斥
- AsyncTask内的各个方法调用顺序
- DOS命令
- 控制文本和外观------Attr Binding(attr属性绑定)
- VS2008向工具箱中添加控件解决 未能实例化 设计时授权
- 我的openwrt学习笔记(三):linux基础命令学习
- WINSERVER2008 IIS7 配置ASP 老程序
- 1071. Speech Patterns
- 数组中的逆序对
- 关于Solaris的9个小技巧
- 简单网页源码查看器
- 详解PHP中的mb_detect_encoding函数使用方法
- http访问服务器rest格式请求
- HDU 5100 Chessboard (用k×1的矩形覆盖n×n的正方形)(找规律)
- X的追求道路
- 1036. Boys vs Girls
- jvm虚拟机结构
- cocos2d-x中有一个JniHelper类详细使用
- 导致实例逐出的五大问题