您的位置:首页 > 编程语言 > Python开发

python中的正则表达式笔记与总结

2015-04-12 12:31 190 查看
    最近在学习python编写爬虫,其中对正则表达式有要求,就学了点正则表达式。本文作为一个总结。。。

    正则表达式regular expression(regex)是一种字符串,由字符和特殊符号组成,描述了字符和字符的某种重复方式,能按某种模式匹配一系列有相似特征的字符串。

    注意点:匹配match指从一个字符串的开始进行部分or全部匹配,搜索search指从字符串的任意位置进行模式的匹配。

     正则表达式使用的字符和特殊字符,见下表:

    即大概有:管道符号(|) 、任意单个字符(.)、字符串的开头or结尾or单词边界开始匹配(^、$、\b、\B)、创建字符类([])、指定范围(-)和否定(^)、闭包操作符(*、+、?、{})实现多次出现或重复匹配(使用的是贪心策略!!)、特殊字符表示和字符集、圆括号(())创建子组。

    正则表达式有多种多样的风格,但正则表达式本身是固定的。

     python中re模块的主要函数:

   

   

    
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: