python正则表达式
2015-11-01 19:01
579 查看
python实在强大,用来制作爬虫是非常好的选择,能让你快速地开发一个爬虫工具。
python封装好的正则表达式函数,十分方便
#返回pattern对象
re.compile(string[,flag])
#以下为匹配所用函数
re.match(pattern, string[, flags]) //从开头开始匹配,遇到不匹配就结束
re.search(pattern, string[, flags]) //整段都进行匹配,到找到为止
re.split(pattern, string[, maxsplit]) //将指定的字符去掉,然后进行分割
re.findall(pattern, string[, flags]) //符合匹配条件的全部能找到
re.finditer(pattern, string[, flags])搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器
re.sub(pattern, repl, string[, count])使用repl替换string中每一个匹配的子串后返回替换后的字符串。
当repl是一个字符串时,可以使用\id或\g、\g引用分组,但不能使用编号0。
当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。
re.subn(pattern, repl, string[, count])返回 (sub(repl, string[, count]), 替换次数)。
python封装好的正则表达式函数,十分方便
#返回pattern对象
re.compile(string[,flag])
#以下为匹配所用函数
re.match(pattern, string[, flags]) //从开头开始匹配,遇到不匹配就结束
re.search(pattern, string[, flags]) //整段都进行匹配,到找到为止
re.split(pattern, string[, maxsplit]) //将指定的字符去掉,然后进行分割
re.findall(pattern, string[, flags]) //符合匹配条件的全部能找到
re.finditer(pattern, string[, flags])搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器
re.sub(pattern, repl, string[, count])使用repl替换string中每一个匹配的子串后返回替换后的字符串。
当repl是一个字符串时,可以使用\id或\g、\g引用分组,但不能使用编号0。
当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。
re.subn(pattern, repl, string[, count])返回 (sub(repl, string[, count]), 替换次数)。
相关文章推荐
- python 随机产生多维高斯分布点
- python配置mysqldb环境
- Python使用urllib2 POST数组
- Eclipse搭建Python和Django环境
- python常用模块
- python装饰器
- python-time模块
- python正则表达式
- python str和repr 的区别
- 关于Python的super用法研究(转)
- LeetCode----Partition List
- python 输出乱码
- python numpy教程
- Mac OS X 安装pip , ipython
- Learn Python The Hard Way 总结与勘误
- Python中的元组,列表与字典
- pip——windows下安装python包工具
- wxpython
- python常见编译错误:IndentationError缩进错误
- Python3的re.match()、re.search()和re.findall()