您的位置:首页 > 编程语言 > Python开发

正则表达式在Python下的基础应用

2018-01-26 23:08 471 查看
rematch 函数

research 函数

resub 函数

refindall 函数

Python支持的正则表达式元字符和语法

贪婪与非贪婪

1. re.match() 函数

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

例如:

import datetime
now = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
import re

# 常用情况1:
year = re.match('2018', now)
print(year)
# <_sre.SRE_Match object; span=(0, 4), match='2018'>

# 常用情况2:
match_date = re.match(r'(\d{4})-(\d{2}-(\d{2}))', now)
print(match_date)  # <_sre.SRE_Match object; span=(0, 10), match='2018-01-26'>
print(match_date.group())  # 2018-01-26
print(match_date.group(1))  # 2018
print(match_date.group(2))  # 01
print(match_date.group(3))  # 26

# re.match() 必须从开始就进行匹配
match_time = re.match(r'(\d{2}):(\d{2}):(\d{2})', now)
print(match_time)  # None


2. re.search() 函数

re.search 扫描整个字符串并返回第一个成功的匹配。

# 基本同 re.match() ,但是可以从任何位置匹配
match_time = re.search(r'(\d{2}):(\d{2}):(\d{2})', now)
print(match_time)
# <_sre.SRE_Match object; span=(11, 19), match='22:31:21'>


3. re.sub() 函数

re.sub用于替换字符串中的匹配项。

# 提取url中的主要域名
url = 'http://mp.blog.csdn.net/mdeditor'
domain = re.sub(r"(?<!/)/(?!/)\S*", "", url)
print(domain)  # http://mp.blog.csdn.net 
# 字符串中数字乘2
def double(matched):
value = int(matched.group('value'))
return str(value * 2)
s = 'A23G4HFD567'
s_nd = re.sub('(?P<value>\d+)', double, s)
print(s_nd)
# A46G8HFD1134


4. re.findall() 函数

re.findall() 找出所有匹配的项,并返回一个匹配项的列表。

# 找出日期中所有的数字
now = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
match_list = re.findall(r'\d+', now)
match_list  # ['2018', '01', '26', '22', '58', '22']


5. Python支持的正则表达式元字符和语法



图片转自: https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

6. 贪婪与非贪婪

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪则相反,总是尝试匹配尽可能少的字符。在”*”,”?”,”+”,”{m,n}”后面加上?,使贪婪变成非贪婪。

s = 'abcdefg'
m = re.search(r'\S+', s)
print(m.group())  # abcdefg
m = re.search(r'\S+?', s)
print(m.group())  # a
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: