您的位置:首页 > 编程语言 > C#

C#正则表达式

2015-12-23 19:27 357 查看
假设我们要判断一个字符串中是否只含有数字,我们怎么办?我们最想到的应该是下面的一段代码:

string str = "what a nice day!";
bool flag = true;
for (int i = 0; i < str.Length; i++) {
if (str[i] >= 0 && str[i] <= 9)
{
}
else {
flag = false;
break;
}
}
Console.WriteLine(flag);


好在C#为我们提供了索引器这一工具,让我们可以像访问数组的方式来访问字符串。但是上面的方法未免有点麻烦,活着说有一些局限性,如果我们要验证一个字符串是否是Email格式的呢?再通过比较字符的方法,可能就有很大的难度。那么我们来通过正则表达式的方法来改写上面的代码:

string str = "what a nice day!";
Console.WriteLine(Regex.IsMatch(str, "^\\d*$"));


这样我们就可以验证我们的字符串是否是纯数字构成的了。

上面的例子只是为了展示正则表达式的强大。只用几个字符就解决了字符串验证的问题。下面就来介绍正则表达式:

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:

1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);

2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。

正则表达式的特点是:

1. 灵活性、逻辑性和功能性非常的强;

2. 可以迅速地用极简单的方式达到字符串的复杂控制。

3. 对于刚接触的人来说,比较晦涩难懂。

—–by baidu

由一些普通字符和一些元字符组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。元字符这里不做一一列举,大家可以自行搜索。下面就对常用的元字符进行分类,一一介绍。

C#中的正则表达式

C#中使用正则表达式时,我们需要调用System.Text.RegularExpressions中的Regex类中的而一些方法。这个类为我们封装了一些常用的操作,如IsMatch,Replace等等,以及他们的重载。

定位元字符^,$

比如我们在一些网站上注册的时候,会要求用户名规则,比如说必须是字母开头,那么他们是如何检测的呢?看代码:

string str = Console.ReadLine(); ;
string pattern = "^[A-z]";//表示首字符必须是字母

Console.WriteLine(Regex.IsMatch(str, pattern));


上面的IsMatch返回一个bool类型,如果str与pattern中的字符串要求匹配,返回True,否则False。来看正则表达式pattern。[A-z]表示匹配范围,由于在ascii表中A要比z小,所以是A-z。^这个元字符就表示匹配首位字符。与之对应的就是$,表示匹配末位字符,如果我们需要末位字符是字母,只需要把pattern改成

string pattern = "[A-z]$";


基本元字符

我们来看一下正则表达式中的一些常用的基本元字符

. :匹配除换行符以外的任意字符

\w : 匹配字母,数字,下划线,汉字

\W: \w的补集

\s: 匹配任意空白符(空格,换行符,制表符等等)

\S: \s的补集

\d: 匹配数字(0-9)

\D : \d的补集

*: 匹配前面的子表达式任意次

现在我们要检测一个字符串中是否有出数字以外的字符,代码如下:

string str = Console.ReadLine(); ;
string pattern = @"^\d*$";

Console.WriteLine(Regex.IsMatch(str, pattern));


看pattern字符串:\d表示匹配数字,表示匹配数字任意次,^和限制了开头和结尾。如果我们没有和限制了开头和结尾。如果我们没有^和的话,那么字符串中有没有数字返回值都是True,因为表示匹配任意次,包括0次。

反义字符

我们上面列的\W,\S和\D就是反义字符,另外还有一些别的反义字符的写法,如:[^x]表示匹配除了x以外的字符。例如我们把除了字母以外的字符全部替换成a,我们可以这样写:

string str = Console.ReadLine(); ;
string pattern = @"[^A-z]";

Console.WriteLine(Regex.Replace(str, pattern,"a"));


这样我们输入123,那么久会输出aaa。

重复匹配字符

重复匹配字符就是表示匹配前面的字符n次。如{n}表示匹配前面的字符n次,{n,}表示匹配前面的字符至少n次。{n,m}表示匹配前面的字符n到m次。比如我们要检验QQ号是否合法,代码如下:

string str = Console.ReadLine(); ;
string pattern = @"^\d{5,10}$";

Console.WriteLine(Regex.IsMatch(str, pattern));


QQ号一般是5到10位的数字,所以我们匹配数字5到10次,由于我们限定了首位和末位,所以如果字符数大于10或者小于5也会返回False。

择一匹配字符

择一匹配字符只有一个|,类似于或运算,符合我们给出匹配条件中的一个就行了。例如我们过滤字符串中所有的数字和字母,可以这样:

string str = Console.ReadLine(); ;
string pattern = @"\d|[A-z]";
MatchCollection result= Regex.Matches(str, pattern);//返回结果到一个集合中
foreach (Match res in result) {
Console.WriteLine(res.ToString());//输出过滤出的对象
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: