您的位置：首页 > 其它

强大的正则表达式

2016-07-01 12:29 225 查看

正则表达式

正则表达式并不是一个经常使用的工具,它主要用来对文字进行查找,替换,匹配等操作,下面我们进行具体的介绍:

. ：匹配任何单个字符。例如正则表达式“b.g”能匹配如下字符串：“big”、“bug”、“b
g”，但是不匹配“buug”，“b..g”可以匹配“buug”。

   [ ] ：匹配括号中的任何一个字符。例如正则表达式“b[aui]g”匹配bug、big和bag，但是不匹配beg、baug。可以在括号中使用连字符“-”来指定字符的区间来简化表示，例如正则表达式[0-9]可以匹配任何数字字符，这样正则表达式“a[0-9]c”等价于“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串；还可以制定多个区间，例如“[A-Za-z]”可以匹配任何大小写字母，“[A-Za-z0-9]”可以匹配任何的大小写字母或者数字。

   ( ) ：将 () 之间括起来的表达式定义为“组”(group)，并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。把一些字符表示为一个整体。改变优先级、定义提取组两个作用。

   | ：将两个匹配条件进行逻辑“或”运算。'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。

   *：匹配0至多个在它之前的子表达式，和通配符*没关系。例如正则表达式“zo*”能匹配
“z” 、“zo”以及 “zoo”；因此“.*”意味着能够匹配任意字符串。"z(b|c)*"→zb、zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab（用括号改变优先级）。

   + ：匹配前面的子表达式一次或多次，和*对比（0到多次）。例如正则表达式9+匹配9、99、999等。
“zo+”能匹配 “zo”以及 “zoo”
，不能匹配"z"。

   ? ：匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 。一般用来匹配“可选部分”。

   {n} ：匹配确定的 n 次。"zo{2}"→zoo。例如，“e{2}”
不能匹配“bed”中的“e”，但是能匹配“seed”中的两个“e”。

{n,} :至少匹配n次。例如，“e{2,}”不能匹配“bed”中的“e”，但能匹配
“seeeeeeeed”中的所有“e”。

{n,m} ：最少匹配 n 次且最多匹配 m 次。“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。

^（shift+6）：匹配一行的开始。例如正则表达式“^regex”能够匹配字符串“regex我会用”的开始，但是不能匹配“我会用regex”。

^另外一种意思：非！（暂时不用理解）

   $ ：匹配行结束符。例如正则表达式“浮云$”
能够匹配字符串“一切都是浮云”的末尾，但是不能匹配字符串“浮云呀”

   \d：代表一个数字，等同于[0-9]

\D：代表非数字，等同于[^0-9]

\s：代表换行符、Tab制表符等空白字符

\S：代表非空白字符

\w：匹配字母或数字或下划线或汉字，即能组成单词的字符

\W：非\w ，等同于[^\w]

d：digital；s：space、w：word。大写就是“非”

   Regex.IsMatch("bbbbg","^b.*g $");

Regex.IsMatch("bg", "^b.*g $ ");

Regex.IsMatch("gege", "^b.*g $ ");

"^\d{3,4}\-?\d+$"表示被匹配的字符序列应该是由三至四位数字组成，由于长途区号的连字符“-”可有可无，所以这里使用“?”元字符进行说明。由于连字符“-”在正则表达式中有特殊含义(表示范围，比如[0-9])，所以要对其进行转义。

[]括号中的任意字符，\w字母、数字、下划线，+一到多个。由于.在正则表达式中有特殊的含义，因此对于真正想表达“.”则需要转移“\.”。先想正则表达式是语言无关的。

+、*的匹配默认是贪婪(greedy)的：尽可能多的匹配，直到“再贪婪一点儿”其后的匹配模式就没法匹配为止。

在+、*后添加?就变成非贪婪模式（? 的另外一个用途）：让其后的匹配模式尽早的匹配。修改成"我是(.+?)。"

   图片 src[^>]*[^/].(?:jpg|bmp|gif)(?:\"|\')

    中文 ^([\u4e00-\u9fa5]+|[a-zA-Z0-9]+)$

    网址 "\<a.+?href=['""](?!http\:\/\/)(?!mailto\:)(?>foundAnchor>[^'"">]+?)[^>]*?\>"

    匹配中文字符的正则表达式： [\u4e00-\u9fa5]

    匹配双字节字符(包括汉字在内)：[^\x00-\xff]

    匹配空行的正则表达式：\n[\s| ]*\r

    匹配HTML标记的正则表达式：/<(.*)>.*<\/\1>|<(.*) \/>/

    匹配首尾空格的正则表达式：(^\s*)|(\s*$)（像vbscript那样的trim函数）

    匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

    匹配网址URL的正则表达式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航