您的位置:首页 > 编程语言 > Java开发

Java 正则中的(.*?)vs(.*)

2016-04-15 16:50 239 查看
public static void main(String[] args) {

//选择最小和最大重复次数

String a="{user=\"administrator\",password=\"root\"}";

String b="user =\"a\"";//注意=号之间有空格

String c="user\r\n=\"c\"";//注意有换行符号

//获取双引号之间的内容,分别获得a,b,c中的所有的用户的名称

String regex="(?s)user.*?=(\".*?\")";

match(regex,a);//user="administrator"

match(regex,b);//user ="a"

match(regex,c);//user

//="c"

//上面的非常简单,注意以下事例

//选择最小和最大重复数

//注意以下几点,user =这个之间可能有空格

//我们需要的结果是找出user='xxx'的信息,其余不要

String notice="[{user='admin',password='admin'}," +

"{user='yhc',password='yhc'}]";

//也许大家会觉得.*?为什么需要?号,那么一下我们看看

//有?和没有?的区别

String regex1="user.*='(.*?)'";//user.*=之间没有?

match(regex1, notice);

//输出结果(错误):user='admin',password='admin'},{user='yhc',password='yhc'

String regex2="user.*?='(.*?)'";//user.*=之间有?

match(regex2, notice);

//输出结果(正确):

//user='admin'

//user='yhc'

//为什么上面就因为一个?号而有这么大的区别咧?

//解释以上代码运行机制

//有了匹配文本中的第一个user之后,引擎就会到达(.*),其中点号(.)可以

//匹配任意字符,其中包括换行符,星号(*)则把它重复0次或更多次,请注意,

//这里的星号(*)是贪心的,因此点星(.*)会匹配直到目标文件结束的所有的

//内容,注意=====>>>>(.*)会吃了所有的目标文件内容,从第一个匹配

//user的地方开始;

//当(.*)把肚子吃饱之后,引擎才会试图去匹配在目标文本末尾的=

//这个表达式,当然,一定会匹配失败,但这并不会代表此次匹配就结束了,

//正则引擎会进行回溯backtrack,当匹配某一个位置之后

//,正则表达式都会保存一个回溯位置,如果正则表达式匹配之后的文本失败后

//那么正则引擎还可以回到这些位置

//当=匹配匹配失败之后,引擎进行回溯,让(.*)放弃它的匹配中的一个

//字符接着=会被再次尝试匹配,这次在文本中的最后一个字符的位置,

//如果依然失败的话,那么引擎会再一次进行回溯在文件的倒数第2个字符出尝试匹配

//这个过程会一直继续,直到=匹配成功位置,如果一直没有匹配成功,那么最终(.*)

//会用完所有的回溯位置,然后正则匹配失败

//如果在整个回溯的过程中=在某个点匹配成功,那么就会接着尝试匹配'如果'匹配

//失败,引擎接着进行回溯,这个过程会一直重复,直到='(.*?)'可以被匹配为止

//问题就出现在.*上,因为星号是贪心的,所以你们要注意哦!

//我们需要使用lazy 懒惰 可以在后面放一个?使其变为懒惰

//例如:(*?),(+?),(??) ,{1,100}? 都可以将其变为懒惰

}

public static void match(String regex,String input){

//创建正则对象

Pattern pattern=Pattern.compile(regex);

//匹配对象

Matcher matcher=pattern.matcher(input);

//输出匹配字符串

while(matcher.find()){

System.out.println(matcher.group());

}

}

如果以上有写错误的地方,请大家指出,thanks!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: