[Python]解决正则表达式的"贪婪"匹配
2014-07-22 23:04
1026 查看
我们看下面的匹配:
REF:Core Python Programming
>>> str = 'Wed Feb 27 12:07:46 1985::zwcqrlu@zyifcxsleb.com::478325266-7-10' >>> pat = '\d+-\d+-\d+' >>> reg = re.compile(pat) >>> reg.search(str).group() '478325266-7-10'如果把模式串换成下面并且用match()来匹配:
>>> pat2 = '.+\d+-\d+-\d+' >>> reg2 = re.compile(pat2) >>> reg2.match(str).group() 'Wed Feb 27 12:07:46 1985::zwcqrlu@zyifcxsleb.com::478325266-7-10'而我们希望得到的是后面的那个478325266-7-10,所以模式串加进括号:
>>> pat3 = '.+(\d+-\d+-\d+)' >>> reg3 = re.compile(pat3) >>> reg3.match(str).group(1) '6-7-10'可以看到,匹配到的子组很短,这是因为正则表达式本身默认是贪心匹配的,即如果正则表达式模式中使用到通配字,那它按照从左到右的顺序求值时,会尽量“抓取”满足匹配的最长字符串。一个解决的办法是用"非贪婪"操作符"?"。这个操作符可以用在"*"、“+”或"?"的后面。它的作用是要求正则表达式引擎匹配的字符越少越好。因此,如果把“?”放在“.+”的后面,就可以得到想要的结果:
>>> pat4 = '.+?(\d+-\d+-\d+)' >>> reg4 = re.compile(pat4) >>> reg4.match(str).group(1) '478325266-7-10'
REF:Core Python Programming
相关文章推荐
- 关于正则表达式 g,m 参数的总结,为了回答“正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?”
- python非贪婪、多行匹配正则表达式例子
- python非贪婪、多行匹配正则表达式
- pydev python Ŀ "Unresolved import:"出现错误的解决方法
- Python正则表达式非贪婪、多行匹配功能示例
- 正则表达式中的"?"
- (学习)python非贪婪、多行匹配正则表达式例子
- Python正则表达式中的 零宽断言 …
- 关于正则表达式 g,m 参数的总结,为了回答“正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?”
- 通过例子学习正则表达式(二)--检查输入的"钱"
- 向ACCESS中的"时间/日期"字段中插入DateTime.Now时出现“标准表达式中数据类型不匹配。”错误的解决办法
- 关于正则表达式 g,m 参数的总结,为了回答“正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?”
- 从discuz的"欣"字不能注册看正则匹配及它的解决方案
- 关于正则表达式 g,m 参数的总结,为了回答“正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?”
- 向ACCESS中的"时间/日期"字段中插入DateTime.Now时出现“标准表达式中数据类型不匹配。”错误的解决办法
- preg_match正则表达式匹配 && 正则表达式
- python正则表达式之贪婪引发的匹配无法退出,CPU 100%
- “正则表达式(/[^0-9]/g,'')中的"/g"是什么意思”
- python 正则表达式的贪婪匹配与非贪婪匹配
- python非贪婪、多行匹配正则表达式例子[转载]