您的位置:首页 > 其它

正则表达式-01 初识

2015-03-01 16:19 477 查看
简介:正则表达式,又称正规表示法、常规表⽰法(Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配⼀系列符合某个句法规则的字符串。在很多文本编辑器⾥,正则表达式通常被⽤用来检索、替换那些符合某个模式的文本。

使用:正则表达式在使用的时候

1.需要有一个被检索的对象(字符串).

2.需要有一个检索的条件(规则).

3.检索时采用的策略,比如说,不区分大小写等等.

这里重点需要学习跟记忆的是正则表达式的语法,当然需要有一个印象就可以了,需要用的时候再来查询.

创建项目的时候,不需要创建iPhone项目,只需要创建命令行项目就可以了,因为现在学习正则表达式的使用不需要用到界面的东西.

在oc中有一个专门来使用正则表达式的类,这个类是NSRegularExpression,使用这个类能很方便直接地使用正则表达式来处理字符串.

语法:

.:匹配任何单个字符。例如正则表达式“b.g”能匹配如下字符串:“big”、“bug”、“b g”,但是不匹配“buug”,“b..g”可以匹配“buug”。

[ ]:匹配括号中的任何一个字符。例如正则表达式“b[aui]g”匹 配bug、big和bag,但是不匹配beg、baug。可以在括号中使⽤连字 符“-”来指定字符的区间来简化表⽰,例如正则表达式[0-9]可以匹配任何数字符,这样正则表达式“a[0-9]c”等价于“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串;还可以制定多个区间,例如“[A-Za-z]”可以匹配任何大小写字母,“[A-Za-z0-9]”可以匹配任何的⼤小写字⺟母或者数字。

|:将两个匹配条件进行逻辑“或”运算。’z|food’ 能匹配 “z” 或 “food”。’(z|f)ood’则匹配 “zood”或”food”。

():将 ()之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到⼀个临时区域,这个字符在字符串提取的时候⾮常有用。把一些字符表⽰为一个整体。改变优先级、定义提取组两个作用。

:匹配0至多个在它之前的⼦表达式,和通配符没关系。例如正则表达式“zo*”能匹配 “z” 、“zo”以及 “zoo”;因此“.”意味着能够匹配任意字符串。”z(b|c)“→zb、zbc、zcb、zccc、zbbbccc。”z(ab)*”能匹 配z、zab、zabab(⽤用括号改变优先级)。

+:匹配前面的子表达式一次或多次,和*对⽐(0到多次)。例如正则表达式9+匹配9、99、999等。“zo+”能匹配 “zo”以及 “zoo” ,不能匹配”z”。

?:匹配前⾯的子表达式零次或一次。例如,”do(es)?” 可以匹配 “do” 或 “does”。一般用来匹配“可选部分”。

{n}:匹配确定的n次。“zo{2}”→zoo。例如,“e{2}” 不能匹配“bed”中 的“e”,但是能匹配“seed”中的两个“e”。

{n,} :⾄至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配 “seeeeeeeed”中的所有“e”。

{n,m}:最少匹配n次且最多匹配m 次。“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。

^: 非运算 a[^b] 除了b以为的字符 或者^a 以a开头

\d:代表一个数字,等同于[0-9]

\D:代表⾮数字,等同于[^0-9]

\s:代表换行符、Tab制表符等空⽩字符

\S:代表⾮空白字符

\w:匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。

\W:⾮\w ,等同于[^\w]

代码:

[code]int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSString* pattern = @".";//.代表匹配任意的字符
        //第一个参数是使用的方式,也是正则表达式的语法,这个就是我们需要重点学习的地方

        NSError* error = [[NSError alloc]init];
        //options:NSRegularExpressionCaseInsensitive 采用不区分大小写的检索方式
        NSRegularExpression* regularExpression = [NSRegularExpression regularExpressionWithPattern:pattern options:NSRegularExpressionCaseInsensitive error:&error];

        NSString* string = @"http";

        NSArray* resultArray = [regularExpression matchesInString:string options:NSMatchingReportCompletion range:NSMakeRange(0, string.length)];

        for (NSString* result in resultArray) {
            NSLog(@"%@",result);
        }
    }
    return 0;
}


运行结果:

[code]RegularExpression[1685:303] <NSSimpleRegularExpressionCheckingResult: 0x100106310>{0, 1}{<NSRegularExpression: 0x100104520> . 0x1}
RegularExpression[1685:303] <NSSimpleRegularExpressionCheckingResult: 0x100106450>{1, 1}{<NSRegularExpression: 0x100104520> . 0x1}
RegularExpression[1685:303] <NSSimpleRegularExpressionCheckingResult: 0x1001064d0>{2, 1}{<NSRegularExpression: 0x100104520> . 0x1}
RegularExpression[1685:303] <NSSimpleRegularExpressionCheckingResult: 0x100106530>{3, 1}{<NSRegularExpression: 0x100104520> . 0x1}


从上述的运行结果上看,看以看到有一个数据是个range很相似的数据,{0, 1}这个数据意思是,检索到匹配的值,这个值的范围是在第0的位置,长度是1.

也有可能是没有检索到匹配的结果,只要这个返回的数组对象resultArray里面没有值(也就是resultArray.count==0)的话,就没有检索到匹配的对象.

可以添加一段代码:

[code]int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSString* pattern = @".";//.代表匹配任意的字符
        //第一个参数是使用的方式,也是正则表达式的语法,这个就是我们需要重点学习的地方

        NSError* error = [[NSError alloc]init];
        //options:NSRegularExpressionCaseInsensitive 采用不区分大小写的检索方式
        NSRegularExpression* regularExpression = [NSRegularExpression regularExpressionWithPattern:pattern options:NSRegularExpressionCaseInsensitive error:&error];

        NSString* string = @"http";

        NSArray* resultArray = [regularExpression matchesInString:string options:NSMatchingReportCompletion range:NSMakeRange(0, string.length)];

        if(resultArray.count){
            for (NSString* result in resultArray) {
                NSLog(@"%@",result);
            }
        }else{
            NSLog(@"没有检索到匹配的结果");
        }

    }
    return 0;
}


我们检索所得的结果是一个数组来的,如果我们想要将检索到的结果,就需要遍历里面的对象,这个检索结果数组里面存放的对象是NSTextCheckingResult类的,我们可以将这些结果打印出来,添加代码:

[code]int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSString* pattern = @".";//.代表匹配任意的字符
        //第一个参数是使用的方式,也是正则表达式的语法,这个就是我们需要重点学习的地方

        NSError* error = [[NSError alloc]init];
        //options:NSRegularExpressionCaseInsensitive 采用不区分大小写的检索方式
        NSRegularExpression* regularExpression = [NSRegularExpression regularExpressionWithPattern:pattern options:NSRegularExpressionCaseInsensitive error:&error];

        NSString* string = @"http";

        NSArray* resultArray = [regularExpression matchesInString:string options:NSMatchingReportCompletion range:NSMakeRange(0, string.length)];

        if(resultArray.count){
            for (NSTextCheckingResult* result in resultArray) {
//                NSLog(@"%@",result);
                NSLog(@"%@",[string substringWithRange:result.range]);
            }
        }else{
            NSLog(@"没有检索到匹配的结果");
        }

    }
    return 0;
}


运行结果:

[code]RegularExpression[2305:303] h
RegularExpression[2305:303] t
RegularExpression[2305:303] t
RegularExpression[2305:303] p


博文代码(点击下载)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: