详解正则表达式Matcher类中group方法
前言
同事把一个excel表给我,里面的数据大概有几千的样子吧。自己需要把里面的数据一个一个拿出来做一个http请求,对得到的结果进行过滤,然后再写到上面去。这是就涉及到用脚本来进行操作了,于是自己搞了一个Java的脚本出来,里面涉及到一些正则表达式,自己虽然说会,但是一直对Matcher类中的group方法不太了解。网上的博客也没有写的特别清楚,于是有了此文。
0|1Pattern和Matcher
在java.util.regex包下
- Pattern(模式类):用来表达和陈述所要搜索模式的对象。Pattern.compile(pattern)pattern也就是你写的正则表达式
- Matcher(匹配器类):真正影响搜索的对象。上面Pattern.compile(pattern)得到一个Pattern对象为r。r.matcher(line)line也即是你需要进行匹配的字符串。这样会得到一个Matcher的对象。
- PatternSyntaxException:当遇到不合法的搜索模式时,会抛出例外。
0|1正则表达式语法
在有的语言中,一个反斜杠\就足以具有转义的作用,但是Java中需要两个\\反斜杠。表示转义的作用。一些字符在正则表达式中的说明,意义。详情可查看runoob
0|1上代码
现在我的正则表达式为(//d+)([a-z]+)(//d+)
- //d+表示最少匹配一个数字
- [a-z]+表示最少匹配一个字符
- 需要指定的字符串为"123ra9040123123aj234adf12322ad222jsk22"
- 代码如下:
publicstaticvoidmain(Stringargs[]){ //按指定模式在字符串查找 Stringline="123ra9040123123aj234adf12322ad222jsk22"; Stringpattern="(\\d+)([a-z]+)(\\d+)"; //Stringpattern1="([\\u4E00-\\u9FA5]+|\\w+)"; //创建Pattern对象 Patternr=Pattern.compile(pattern); //现在创建matcher对象 Matcherm=r.matcher(line); inti=0; //m.find是否找到正则表达式中符合条件的字符串 while(m.find()){ //拿到上面匹配到的数据 System.out.println("----i="+i); System.out.println("Foundvalue:"+m.group(0)); System.out.println("Foundvalue:"+m.group(1)); System.out.println("Foundvalue:"+m.group(2)); System.out.println("Foundvalue:"+m.group(3)); i++; System.out.println("|||||||"); System.out.println(""); } }
输出:
----i=0
Foundvalue:123ra9040
Foundvalue:123
Foundvalue:ra
Foundvalue:9040
|||||||
----i=1
Foundvalue:123123aj234
Foundvalue:123123
Foundvalue:aj
Foundvalue:234
|||||||
----i=2
Foundvalue:222jsk22
Foundvalue:222
Foundvalue:jsk
Foundvalue:22
|||||||
group(0)对应着((//d+)([a-z]+)(//d+))123ra9040
group(2)输出的数据是group(0)中所匹配的数据也就是([a-z]+)匹配到是数据ra
group(3)输出的数据是group(0)中所匹配的数据也就是(//d+)匹配到是数据9040
0|1总结
Matcher类中group(0)表示正则表达式中符合条件的字符串。
Matcher类中group(1)表示正则表达式中符合条件的字符串中的第一个()中的字符串。
Matcher类中group(2)表示正则表达式中符合条件的字符串中的第二个()中的字符串。
Matcher类中group(3)表示正则表达式中符合条件的字符串中的第三个()中的字符串。
如果不明白,我相信看代码会很明白的。
总结
以上所述是小编给大家介绍的正则表达式Matcher类中group方法,希望对大家有所帮助,如果大家有任何疑问欢迎给我留言,小编会及时回复大家的!