您的位置:首页 > 其它

正则表达式必知必会

2016-04-01 02:34 260 查看
作者:Ben Forta——世界著名专家、Aodbe技术界知名专家,《SQL必知必会》、《MySQL必知必会》作者。

1. 概述:

正则表达式(regular expression,简称regex);

用途:搜索替换

由正则语言创建,嵌入到其他语言或软件产品中的“迷你”语言

语法较简单真正的挑战是解决实际的问题;

默认只返回第一个匹配结果,但都有获取全部的机制。比如JavaScript里,可选的g(意思是global,全局)标志将返回一个包含着所有匹配结果数组;

默认区分大小写,但都支持不区分的方式。比如JavaScript可用i标志来强制执行一次不区分字母大小写的搜索。

2. 正则表达式字符含义:

字符说明
.匹配任何一个单个字符,如果必须需要一个“. ”,则需要\转义。
\是一个元字符(metacharacter,表示“这个字符有特殊含义,而不是字符本身含义”)。在匹配它本身的时候,必须把它转义为\\。
[]字符集合,其内可存放ASCII字符表里的任意字符,至少匹配集合中任意一个字符。
-在字符集合中作为连字符,其他时候只是一个普通字符,无须转义。
^取非匹配。

对“-”如何使用的简单说明:

A-Z,匹配从A到Z的所有大写字母;

a-z,匹配从A到Z的所有小写字母;

A-z,在ASCII中,从字符A到z的所有字符。注意:此模式不常用,因为它还包含[和^等在ASCII字符表里排列在Z和a之间的字符。

[0-9]的功能与[0123456789]完全相同。

3. 空白元字符:

元字符说明
[\b]回退(并删除)一个字符(Backspace键)
\f换页符
\n换行符
\r回车符
\t制表符(Tab键)
\v垂直制表符
注意:\r\n匹配一个“回车+制表”组合,这是Windows系统文本行结束标签。Unix和Linux系统只使用一个换行符结束一个文本行。同时适用于Windows、Unix和Linux系统的正则表达式应该包含一个可选的\r和一个必须的\n。

4. 数字元字符:

元字符说明
\d任何一个数字,等价于[0-9]。
\D任何一个非数字,等价于[^0-9]。
配套的工具:

Regular Expression Tester(正则表达式测试器)

https://regex101.com/

http://www.regexpal.com/

5. 参考文档

正则表达式所有元字符及其使用方法一览表
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  regex