您的位置:首页 > 编程语言 > Java开发

java正则表达式中的数量词介绍及区别

2014-10-14 12:41 344 查看
Java的正则表达式相关的类位于 java.util.regex 包中;

这个包中只有一个 MatchResult 接口和 Matcher、Pattern 两个类;

有关正则表达式的使用请参考Java API.

本文只是简单的介绍正则表达式中的数量词,并举例说明其区别.

正则表达式中的数量词有: Greedy(贪婪), Reluctant(懒惰), Possessive(强占)三种,一下分别介绍;

Greedy 数量词

X?        X,一次或一次也没有

X*        X,零次或多次

X+        X,一次或多次

X{n}      X,恰好 n 次

X{n,}     X,至少 n 次

X{n,m}    X,至少 n 次,但是不超过 m 次

Greedy是最常用的,它的匹配方式是先把整个字符串吞下,然后匹配整个字符串;

如果不匹配,就从右端吐出一个字符,再进行匹配,直到找到匹配或把整个字符串吐完为止.

Matcher m=Pattern.compile("a.*b").matcher("a====b=========b=====");
while(m.find()){
System.out.println(m.group());
}

输出:
a====b=========b


因为总是从最大匹配开始匹配,故称贪婪.

Reluctant 数量词

X??       X,一次或一次也没有

X*?       X,零次或多次

X+?       X,一次或多次

X{n}?     X,恰好 n 次

X{n,}?    X,至少 n 次

X{n,m}?   X,至少 n 次,但是不超过 m 次

Reluctant正好和Greedy相反,它先从最小匹配开始,先从左端吞入一个字符,然后进行匹配;

若不匹配就再吞入一个字符,直到找到匹配或将整个字符串吞入为止.

Matcher m=Pattern.compile("a.*?b").matcher("a====b=========b=====");
while(m.find()){
System.out.println(m.group());
}

输出:
a====b


因为总是从最小匹配开始,故称懒惰

Possessive 数量词

X?+       X,一次或一次也没有

X*+       X,零次或多次

X++       X,一次或多次

X{n}+     X,恰好 n 次

X{n,}+    X,至少 n 次

X{n,m}+   X,至少 n 次,但是不超过 m 次

Possessive和Greedy的匹配方式一样,先把整个字符串吞下,然后匹配整个字符串;

如果匹配,就认为匹配;如果不匹配,就认为整个字符串不匹配;

它不会从右端吐出一个字符串再进行匹配,只进行一次.

Matcher m=Pattern.compile("a.*+b").matcher("a====b=========b=====");
while(m.find()){
System.out.println(m.group());
}
输出:


因为贪婪但并不聪明,故称强占.

本文转载自:http://blog.csdn.net/zfq642773391/article/details/5506618
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息