您的位置:首页 > 其它

正则表达式的基本用法

2015-09-16 20:53 204 查看
常用元字符:

查找hi : \bhi\b  \b 代表单词的开头或结尾,也就是单词的分界处

查找hi后面不远处跟着Lucy : \bhi\b.\lucy\b   . 表示除了换行符以外的任意字符     .* 表示任意数量的不包含换行的字符

0\d\d-\d\d\d\d\d\d\d\d\d : 以0开头,两个数字,然后一个连字符,8个数字, 也就是中国的区号为三位电话号码 —> 0\d{2}-\d{8}

\d :匹配数字 \d{5, 12}  5到12个数字

\s : 匹配任意的空白符(空格、制表符、换行符、中文全角空格)

\w : 匹配字母或数字或下划线或汉字等

^  : 匹配字符串的开始

$  : 匹配字符串的结束

使用\取消字符本身的意思  如:aa.net —>  aa\.net

常用限定符:

*   重复零次或更多次
+   重复一次或更多次
?  重复一次或零次
{n}   重复n次
{n,}  重复n次或更多次

{n, m}重复n到m次

例 :^\w+  匹配一行的第一个单词

在方括号中匹配想要查找的字符如:[aeiou] 匹配任何一个元音字母

匹配数字 [0-9] ==> \d  

分枝条件:

分枝条件指的是,有几种规则,如果满足其中任意一种规则都应当成匹配,使用 | 把不同规则分隔开

0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)

分组:
重复多个字符

匹配一个简单的IP地址:
(\d{1,3}\.){3}\d{1,3}是一个简单的IP地址匹配表达式。要理解这个表达式,请按下列顺序分析它:\d{1,3}匹配1到3位的数字,(\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次,最后再加上一个一到三位的数字(\d{1,3})

它也可能匹配256.300.888.999这种不可能存在的IP地址。如果能使用算术比较的话,或许能简单地解决这个问题,但是正则表达式中并不提供关于数学的任何功能,所以只能使用冗长的分组,选择,字符类来描述一个正确的IP地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

2[0-4]\d | 25[0-5] | [01]?\d\d

反义:

查找某个不属于简单定义的自负类的字符
\W  匹配任意不是字母、数字、下划线、汉字的字符
\S   匹配不是空白符的字符
\D   匹配非数字字符
\B   匹配不是单词开头或结束的字符
[^x]  匹配除x以外的字符
[^aeiou] 匹配除元音字母以外的字符

如:<a[^>]+> 匹配用尖括号括起来的以a开头的字符串
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: