您的位置:首页 > 其它

量词描述了一个模式吸收输入文本的方式

2013-08-26 12:02 302 查看
贪婪的:量词总是贪婪的,除非有其他的选项被设置。贪婪表达式会为所有可能的模

式发现尽可能多的匹配。导致此问题的一个典型理由就是假定我们的模式仅能匹配第

一个可能的字符组,如果它确实是贪婪的,那么它就会继续往下匹配。

 勉强的:用问号来指定,这个量词匹配满足模式所需的最少字符数。因此也称作懒惰

的、最少匹配、非贪婪的或不贪婪的(lazy, minimal matching, non-greedy, or

ungreedy)。

 占有的:量词当前只有在 java 语言中才可用(在其他语言中不可用),并且它也更

高级,因此我们大概不会立刻用到它。当正则表达式被应用于字符串时,它会产生相

当多的状态以便在匹配失败时可以回溯。而占有量词并不保存这些中间状态,因此它

们可以防止回溯。它们常常用于防止正则表达式失控,因此可以使正则表达式执行起
来显得更有效。

我们应该非常清楚地意识到表达式’X’通常必须要用圆括号括起来,以便它能够按照我们期

望的效果去执行。例如:

abc+

看起来它似乎应该匹配一个或多个’abc’序列,如果我们把它应用于输入字符串

‘abcabcabc’,我们实际上会获得 3 个匹配。然而,这个表达式实际上表示的是:匹配’ab’,

后面跟随一个或多个’c’。为了匹配一个或多个完整的’abc’字符串,我们必须这样表示:

(abc)+

你会发现在使用正则表达式时,很容易混淆。因为它是一种在 Java 之上的新语言。



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐