您的位置：首页 > 其它

正则表达式的基本用法

2015-09-16 20:53 204 查看

常用元字符：

查找hi ： \bhi\b  \b 代表单词的开头或结尾，也就是单词的分界处

查找hi后面不远处跟着Lucy ： \bhi\b.\lucy\b   . 表示除了换行符以外的任意字符     .* 表示任意数量的不包含换行的字符

0\d\d-\d\d\d\d\d\d\d\d\d : 以0开头，两个数字，然后一个连字符，8个数字，也就是中国的区号为三位电话号码 —> 0\d{2}-\d{8}

\d ：匹配数字 \d{5, 12}  5到12个数字

\s ：匹配任意的空白符（空格、制表符、换行符、中文全角空格）

\w ：匹配字母或数字或下划线或汉字等

^ ：匹配字符串的开始

$ ：匹配字符串的结束

使用\取消字符本身的意思  如：aa.net —>  aa\.net

常用限定符：

*   重复零次或更多次
+   重复一次或更多次
？  重复一次或零次
{n}   重复n次
{n,}  重复n次或更多次

{n, m}重复n到m次

例：^\w+ 匹配一行的第一个单词

在方括号中匹配想要查找的字符如：[aeiou] 匹配任何一个元音字母

匹配数字 [0-9] ==> \d

分枝条件：

分枝条件指的是，有几种规则，如果满足其中任意一种规则都应当成匹配，使用 | 把不同规则分隔开

0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码：一种是三位区号，8位本地号(如010-12345678)，一种是4位区号，7位本地号(0376-2233445)

分组：
重复多个字符

匹配一个简单的IP地址：
(\d{1,3}\.){3}\d{1,3}是一个简单的IP地址匹配表达式。要理解这个表达式，请按下列顺序分析它：\d{1,3}匹配1到3位的数字，(\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次，最后再加上一个一到三位的数字(\d{1,3})

它也可能匹配256.300.888.999这种不可能存在的IP地址。如果能使用算术比较的话，或许能简单地解决这个问题，但是正则表达式中并不提供关于数学的任何功能，所以只能使用冗长的分组，选择，字符类来描述一个正确的IP地址：((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

2[0-4]\d | 25[0-5] | [01]?\d\d

反义：

查找某个不属于简单定义的自负类的字符
\W 匹配任意不是字母、数字、下划线、汉字的字符
\S 匹配不是空白符的字符
\D 匹配非数字字符
\B 匹配不是单词开头或结束的字符
[^x] 匹配除x以外的字符
[^aeiou] 匹配除元音字母以外的字符

如：<a[^>]+> 匹配用尖括号括起来的以a开头的字符串

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航