您的位置:首页 > 其它

正则表达式基础

2014-03-23 17:18 316 查看

正则表达式用处:

1.以前看学长用php进行爬虫,获取网络上的数据,用到了正则表达式

2.然后就是用js去验证各种提交的数据的也会用到

3.php页面静态化里面的伪静态,rewrite机制也会用到正则

以下是一些基础的字符以及含义:

^ 匹配输入字符串的开始位置

$ 匹配输入字符串结尾的位置

* 零次或多次匹配前面的字符或子表达式

+ 一次或多次匹配前面的字符或子表达式

? 零次或一次匹配前面的字符或子表达式

{n} n是非负整数,正好匹配n次

{n,} n是非负整数,至少匹配n次

{n,m} n和m是非负整数,其中n<m,匹配至少n次,至多m次

. 匹配除“\n”之外的任意字符

x|y 匹配x或者y

[xyz] 字符集,匹配包含的任意字符

[^xyz] 反向字符集,匹配未包含的任何字符

\d 数字字符匹配,等效[0-9]

\D 非数字字符匹配,等效[^0-9]

\s 匹配任何空白字符,包括空格、制表符、换页符等,与[\f\n\r\t\v]等效

\S 匹配任何非空白字符

\w 匹配任何字类字符,包括下划线,与[A-Za-z0-9_]等效

\W 与任何非单词字符匹配

(pattern) 匹配pattern并捕获该匹配的子表达式

(?:pattern)
匹配pattern但不捕获该匹配的子表达式,即它是一个非捕获匹配

(?=pattern)
顺序肯定环视,表示所在位置右侧能够匹配pattern

(?!pattern)
顺序否定环视,表示所在位置右侧不能匹配pattern

(?<=pattern)
逆序肯定环视,表示所在位置左侧能够匹配pattern

(?<!pattern)
逆序否定环视,表示所在位置左侧不能匹配pattern

汉字的utf-8编码的范围\x4e00-\x9fa5

当[\s\S]+、[\d\D]+、[\w\W]+组合时,表示匹配任意字符
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: