Java 正则表达式匹配模式(贪婪型、勉强型、占有型)
Greediness(贪婪型):最大匹配
X?、X*、X+、X{n,}是最大匹配。例如你要用“<.+>”去匹配“a<tr>aava</tr>abb”,也许你所期待的结果是想匹配“<tr>”,但是实际结果却会匹配到“<tr>aava</tr>。
在Greediness的模式下,会尽量大范围的匹配,直到匹配了整个内容,这时发现匹配不能成功时,开始回退缩小匹配范围,直到匹配成功
Stringtest="a<tr>aava</tr>abb"; Stringreg="<.+>"; System.out.println(test.replaceAll(reg,"###"));
输出:a###abb
Reluctant(Laziness)(勉强型):最小匹配
X??、X*?、X+?、X{n,}?是最小匹配,其实X{n,m}?和X{n}?有些多余。在Greediness模式之后添加?就成最小匹配。
在Reluctant的模式下,只要匹配成功,就不再继续尝试匹配更大范围的内容
Stringtest="a<tr>aava</tr>abb"; Stringreg="<.+?>"; System.out.println(test.replaceAll(reg,"###"));
输出:a###aava###abb
与Greediness不同,Reluctant模式下匹配了两次内容
Possessive(占有型):完全匹配
X?+、X*+、X++、X{n,}+是完全匹配,在Greediness模式之后添加+就成完全匹配。
Possessive模式与Greediness有一定的相似性,那就是都尽量匹配最大范围的内容,直到内容结束,但与Greediness不同的是,完全匹配不再回退尝试匹配更小的范围。
Stringtest="a<tr>aava</tr>abb"; Stringreg="<.++>"; Stringtest2="<tr>"; Stringreg2="<tr>"; System.out.println(test.replaceAll(reg,"###")); System.out.println(test2.replaceAll(reg2,"###"));
输出:a<tr>aava</tr>abb