您的位置:首页 > 编程语言 > C#

C#正则表达式(2):常用的特殊字符(元字符,限定字符)

2013-01-17 09:50 246 查看

正则表达式中的限定符和元字符:

元字符就是它是一个特殊的字符,可以代表某个字符或某一类字符.限定符就是指某个字符出现的次数

特殊字符
意思
例子
\
跟字符串的转义字符一样,它也用来转义的.

比如$是个特殊的字符.要匹配$的话就得用\$
^匹配字符串的开头位置^a匹配arwen.但不匹配barwen.
$
匹配字符串的末尾位置en$匹配arwen.但不匹配arwenb.
*
匹配前面的字符0次或多次a*rwen,表示字母a出现0次或多次.可以匹配rwen或aaarwen.
+匹配前面的字符1次或多次a+rwen表示字母a出现1次或多次.但不能是0次.可以匹配arwen或aarwen.但不能匹配rwen.
?匹配前面的字符0次或1次a?rwen,表示a出现0次或1次.可以匹配arwen或rwen.但不能匹配aarwen.
{n}匹配前面的字符恰好是n次,其中n是整数ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen.
{n,m}匹配前面的字符至少是n次,最多是m次.如果写成

{n,}表示最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.
.点号,匹配除换行以外的任意单个字符.换行符用\n表示

arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn.
\w匹配字符或数字,下划线,汉字
\d匹配数字
\s匹配任何空白字符貌似回车符\r和换行符\n也被算作空白字符.
\b匹配单词的开关或结尾这个要和^,$匹配字符的开关和结尾区分下.我们是把空格隔开的一串字符当作一个单词.但字符串是整个的一长串字符
注意:特殊字符都区别大小写的,上面的字符全部是小写

表示反义的字符

上面说的字符都是小写的.有些对应的大写字符就表示相反的意思

\W匹配何意不是字母,数字,下划线,汉字的字符.

\S匹配任意不是空白的字符

\D匹配任意不是数字的字符

\B匹配不是单词开始或结束的位置

小括号,中括号

中括号:[] ,它表示里面的字符任选一个

比如[abcd]+,就表示abcd这四个字母任意的一个出现1次或多次

小括号()和|结合表示任选一个,其实和[]类似,只不过[]只能任选一个字母,()可以任选一个字符串

(abc|def)+表示abc或def这两个字符串中的任一个出现一次或多次.

另一个是^,在上面提到它表示字符串开头,但要把它放到[]中就取反的意思了.

所以^a是匹配a在字符开头.而[^a]匹配不是字符a的任意字符

还有在[]中用个连接符-表示取值范围[0-9]表示0到9的任意一个数字[a-z]表示任意小写字母中的一个

上面说了这么多规则,那具体怎么用呢,其实用起来很简单,难的是你怎么把上面的规则组合起来实现你想要的条件

还用之前的例子来说,比如从字符串中提取网址

string str ="ahttpp://www.baidu.com/s?tn=sitehao12"; //待提取的源字符

string pattern = @"w{3}\..*\.com"; //这里就是用上面的规则来表达条件.w就表示字母w,如果加个\变成\w表达的意思就不一样了,表示数字,字母,下划线,汉字了

//然后w{3}表示连续出现3次w字母 \.就表示点号.注意如果前面没有@则要表示成\\.反正最好记得每次在寡不字符串前加个@就不用就考虑再给\转义了啊.

//.*就表示除换行符以外的任意字符出现0或多次 \.表示点号 com就表示字符com

string needStr = Regex.Match(str,pattern).Value; //这样就得到想要的结果了.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐