您的位置：首页 > 其它

正则表达式基础

2015-12-12 20:03 375 查看

一个正则表达式，必须首先要编译成为一个Pattern类的实例，这个Pattern对象将会使用matcher()方法来生成一个Matcher实例，接着便可以使用该 Matcher实例以编译的正则表达式为基础对目标字符串进行匹配工作，多个Matcher是可以共用一个Pattern对象的。

最强日期正则表达式

//javascript 的正则表达式

Js代码

var regex = new  RegExp( "\\[([^\\[^\\]]+)\\((\\d{1,6})\\)\\]" ,  "g" );

if (!regExp.test(layer.value))

//JAVA中正则表达式

Java代码

//判断数字

public static boolean isNumeric(String str){

        Pattern pattern = Pattern.compile("[0-9]*");

        return pattern.matcher(str).matches();

     }

Java代码

Pattern p = Pattern.compile("\\d");

Matcher matcher = p.matcher("5");

boolean isOk = matcher.matches();

   System.out.println(isOk);  //true



// recycle the pattern

String tmp = p.pattern();

    System.out.println(tmp); //  \d

Pattern p2 = Pattern.compile(tmp);

matcher = p.matcher("5");

Matcher类:

    使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的.

public String group()
返回由以前匹配操作所匹配的输入子序列。

这个方法提供了强大而方便的工具，他可以等同使用start和end,然后对字符串作substring(start,end)操作。
public String group(int group)
这个方法提供了强大而方便的工具，可以得到指定的group所匹配的输入字符串

(1).

下面我们看看一个小例子,来说明这个问题

\w(\d\d)(\w+)

这个正则表达式有三个组:

整个\w(\d\d)(\w+) 是第0组 group(0)

(\d\d)是第1组 group(1)

(\w+)是第2组 group(2)

我们看看和正则表达式匹配的一个字符串x99SuperJava，

group(0)是匹配整个表达式的字符串的那部分x99SuperJava

group(1)是第1组(\d\d)匹配的部分:99

group(2)是第二组(\w+)匹配的那部分SuperJava

下面我们写一个程序来验证一下：

Java代码

String regex = "\\w(\\d\\d)(\\w+)";

String candidate = "x99SuperJava";



Pattern p = Pattern.compile(regex);

Matcher matcher = p.matcher(candidate);

if(matcher.find()){

     int gc = matcher.groupCount();

     for(int i = 0; i <= gc; i++)

    System.out.println("group " + i + ": " + matcher.group(i));

}

System.out.println(p.pattern());

结果：

group 0: x99SuperJava

group 1: 99

group 2: SuperJava

\w(\d\d)(\w+)

(2)

Java代码

Pattern p = Pattern.compile("B(ond)");

        String candidateString = "My name is Bond. James Bond.";

        Matcher matcher = p.matcher(candidateString);

        matcher.find();

        String group_0 = matcher.group(0);

        String group_1 = matcher.group(1);

        System.out.println("Group 0 : " + group_0);

        System.out.println("Group 1 : " + group_1);

        System.out.println(candidateString);

         //Find group number 1 of the second find

        matcher.find();

        group_0 = matcher.group(0);

        group_1 = matcher.group(1);

        System.out.println("Group 0 : " + group_0);

        System.out.println("Group 1 : " + group_1);

        System.out.println(candidateString);

结果：

Group 0 : Bond

Group 1 : ond

My name is Bond. James Bond.

Group 0 : Bond

Group 1 : ond

My name is Bond. James Bond.

public Pattern pattern()
这个方法返回了，创建Matcher的那个pattern对象。

public Matcher reset()
这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态，并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样，只是这样可以重用以前的对象。

Java代码

String candidateString = "My name is Bond. James Bond.";

        Pattern p = Pattern.compile("Bond");

        Matcher matcher = p.matcher(candidateString);

           //Find the starting point of the first 'Bond'

        matcher.find();

        int startIndex = matcher.start();

        System.out.println(startIndex);  // 11

           //Find the starting point of the second 'Bond'

        matcher.find();

        int nextIndex = matcher.start();

        System.out.println(nextIndex);  // 23



public int start()
这个方法返回了，Matcher所匹配的字符串在整个字符串的的开始下标：
public int end()
这个和start()对应，返回在以前的匹配操作期间，由给定组所捕获子序列的最后字符之后的偏移量。

其实start和end经常是一起配合使用来返回匹配的子字符串。

public boolean matches()
尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。

和find不同， find是会在整个输入字符串查找匹配的子字符串。
public boolean find()
find会在目标字符串中寻找是否有匹配的子字符串，一般我们使用find的流程：

尝试在目标字符串里查找下一个匹配子串。

while(matcher.find()){

    //在匹配的区域，使用group,replace等进行查看和替换操作

}

public boolean find(int start)
从输入字符串指定的start位置开始查找。

来源参考：

http://www.java3z.com/cwbwebhome/article/article8/81313.html?id=3138

http://www.jspcn.net/htmlnews/600100423.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航