您的位置:首页 > 其它

正则表达式

2016-03-02 00:56 197 查看
1.概念

正则表达式,又称正规表示法、常规表示法,计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

2.目的

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
(1.) 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
(2.) 可以通过正则表达式,从字符串中获取我们想要的特定部分。
3.特点
1. 灵活性、逻辑性和功能性非常的强;
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说,比较晦涩难懂。
由于正则表达式主要应用对象是文本,因此它在各种文本编辑器场合都有应用,小到著名编辑器EditPlus,大到Microsoft Word、Visual Studio等大型编辑器,都可以使用正则表达式来处理文本内容。
4.符号
正则表达式由一些普通字符和一些元字符组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。
最简单的元字符是点,它能够匹配任何单个字符(注意不包括换行符)。
5.速记理解技巧
“.”、"[]"、"^"、"$"
四个字符是所有语言都支持的正则表达式,所以这个四个是基础的正则表达式。
(1)等价
?,*,+,\d,\w 都是等价字符
   ?等价于匹配长度{0,1}
  *等价于匹配长度{0,}
   +等价于匹配长度{1,}
   \d等价于[0-9]
  \W等价于[A-Za-z_0-9]。
(2)常用运算符及表达式

^ 开始
   () 域段
   [] 包含,默认是一个字符长度
   [^] 不包含,默认是一个字符长度
   {n,m} 匹配长度
   . 任何单个字符(\. 字符点)
   | 或
   \ 转义
   $ 结尾
  [A-Z] 26个大写字母
   [a-z] 26个小写字母
   [0-9] 0至9数字
[A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字
   , 分割
(3)分隔语法
[A,H,T,W] 包含A或H或T或W字母
   [a,h,t,w] 包含a或h或t或w字母
   [0,3,6,8] 包含0或3或6或8数字
(4)语法与释义
基础语法 "^([]{})([]{})([]{})$"
   正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"
  
   ?,*,+,\d,\w 这些都是简写的,完全可以用[]和{}代替,在(?:)(?=)(?!)(?<=)(?<!)(?i)(*?)(+?)这种特殊组合情况下除外。
   初学者可以忽略?,*,+,\d,\w一些简写标示符,学会了基础使用再按表自己去等价替换
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: