正则表达式规则以及贪婪匹配与非贪婪匹配
2017-02-11 13:25
309 查看
原文地址:http://blog.csdn.net/jethai/article/details/52345368
1、什么是正则表达式的贪婪与非贪婪匹配
如:String str="abcaxc";
Patter p="ab*c";
贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。
非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。
2、编程中如何区分两种模式
默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。
下面的都是量词:
{m,n}:m到n个
*:任意多个
+:一个到多个
?:0或一个
demo代码:
贪婪匹配:在满足匹配时,匹配尽可能长的字符串,默认情况下,采用贪婪匹配
[java]
view plain
copy
string pattern1 = @"a.*c"; // greedy match Regex regex = new Regex(pattern1);
regex.Match("abcabc"); // return "abcabc"
非贪婪匹配:在满足匹配时,匹配尽可能短的字符串,使用?来表示非贪婪匹配
[java]
view plain
copy
string pattern1 = @"a.*?c"; // non-greedy match Regex regex = new Regex(pattern1);
regex.Match("abcabc"); // return "abc"
几个常用的非贪婪匹配Pattern
[java]
view plain
copy
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
3、正则表达式规则
正则表达式的详细规则描述如下所示:
注意:上述规则应该是标准的Unix正则规则,可能因为软件的不同可能会有所差别。比如之前在使用UltraEdit的正则搜索功能时,发现UltraEdit有自己的正则规则,和标准的Unix规则不太一样,比如在Unix中“.”(点)表示匹配除\n以外的任意字符,但是在UltraEdit中“?”(问号)才表示匹配\n以外的任意字符。如果要了解UltraEdit详细的正则规则描述,可以从UltraEdit的主菜单中找到使用帮助菜单项,打开UltraEdit的帮助文档,在帮助文档中有详细的说明。
参考文章:
http://www.cnblogs.com/xudong-bupt/p/3586889.html
1、什么是正则表达式的贪婪与非贪婪匹配
如:String str="abcaxc";
Patter p="ab*c";
贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。
非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。
2、编程中如何区分两种模式
默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。
下面的都是量词:
{m,n}:m到n个
*:任意多个
+:一个到多个
?:0或一个
demo代码:
import java.util.regex.Matcher; import java.util.regex.Pattern; public class RegularTest { public static void main(String[] arg){ String text="(content:\"rcpt to root\";pcre:\"word\";)"; String rule1="content:\".+\""; //贪婪模式 String rule2="content:\".+?\""; //非贪婪模式 System.out.println("文本:"+text); System.out.println("贪婪模式:"+rule1); Pattern p1 =Pattern.compile(rule1); Matcher m1 = p1.matcher(text); while(m1.find()){ System.out.println("匹配结果:"+m1.group(0)); } System.out.println("非贪婪模式:"+rule2); Pattern p2 =Pattern.compile(rule2); Matcher m2 = p2.matcher(text); while(m2.find()){ System.out.println("匹配结果:"+m2.group(0)); } } }
贪婪匹配:在满足匹配时,匹配尽可能长的字符串,默认情况下,采用贪婪匹配
[java]
view plain
copy
string pattern1 = @"a.*c"; // greedy match Regex regex = new Regex(pattern1);
regex.Match("abcabc"); // return "abcabc"
非贪婪匹配:在满足匹配时,匹配尽可能短的字符串,使用?来表示非贪婪匹配
[java]
view plain
copy
string pattern1 = @"a.*?c"; // non-greedy match Regex regex = new Regex(pattern1);
regex.Match("abcabc"); // return "abc"
几个常用的非贪婪匹配Pattern
[java]
view plain
copy
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
3、正则表达式规则
正则表达式的详细规则描述如下所示:
注意:上述规则应该是标准的Unix正则规则,可能因为软件的不同可能会有所差别。比如之前在使用UltraEdit的正则搜索功能时,发现UltraEdit有自己的正则规则,和标准的Unix规则不太一样,比如在Unix中“.”(点)表示匹配除\n以外的任意字符,但是在UltraEdit中“?”(问号)才表示匹配\n以外的任意字符。如果要了解UltraEdit详细的正则规则描述,可以从UltraEdit的主菜单中找到使用帮助菜单项,打开UltraEdit的帮助文档,在帮助文档中有详细的说明。
参考文章:
http://www.cnblogs.com/xudong-bupt/p/3586889.html
相关文章推荐
- 正则表达式(一) 匹配原理/贪婪与非贪婪
- Intent匹配规则以及解析框架.
- Intent匹配规则以及解析框架深入分析
- 正则表达式 高级规则——四(贪婪与非贪婪)
- 正则表达式的贪婪匹配和非贪婪匹配
- Android中隐式Intent以及Intent-filter详解 和匹配规则
- Intent Filter匹配规则,以及使用注意点
- 正则表达式 - 匹配规则
- 正则表达式-贪婪与非贪婪匹配
- Intent匹配规则以及解析框架深入分析
- python非贪婪、多行匹配正则表达式
- 正则表达式的【贪婪匹配】和【懒惰匹配】
- 正则表达式中的贪婪匹配(C#)
- 正则表达式 - 匹配规则
- Intent匹配规则以及解析框架深入分析
- 正则表达式--递归匹配、非贪婪匹配与分组替换
- 正则表达式(二) - 零宽断言与懒惰匹配以及平衡组
- Intent匹配规则以及解析框架深入分析
- 【java规则引擎】模拟rete算法的网络节点以及匹配过程
- 正则表达式(二) - 零宽断言与懒惰匹配以及平衡组