Java正则表达式的实例操作指南

2023-07-16 17:07:04 67

前言

RegularExpression正则表达式，简称RegExp，常规通用的表达式，在多个开发语言中都有它的实现，可以通过正则表达式来快速的检索、匹配、查找、替换字符串中的文本。

简单实例

匹配网址

/*
*File:RegExp.java
*User:iChochy
*URL:https://ichochy.com
*Copyright(c)2020
*Date:2020/09/0718:11:07
*/

packagecom.ichochy.example;

importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

publicclassRegExp{
publicstaticvoidmain(String[]args){
Stringinput="https://ichochy.com";
//正则表达式，(.+)代表一个或多个字符
Stringregex="https://.+.com";
Booleanflag=Pattern.matches(regex,input);
System.out.println(flag);//全文匹配返回：true
}
}

Matches方法

Matcher.matches方法，为整块全匹配，字符串完全匹配返回true。

/*
*File:RegExp.java
*User:iChochy
*URL:https://ichochy.com
*Copyright(c)2020
*Date:2020/09/0718:11:07
*/

packagecom.ichochy.example;

importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

publicclassRegExp{
publicstaticvoidmain(String[]args){
Stringinput="https://ichochy.com";
//正则表达式，(.+)代表一个或多个字符
Stringregex="https://.+.com";
Patternpattern=Pattern.compile(regex);//编译表达式
Matchermatcher=pattern.matcher(input);//匹配表达式
System.out.println(matcher.matches());//全文匹配返回：true
}
}

Find方法

Matcher.find方法，为查找模式匹配，匹配到就返回true。

/*
*File:RegExp.java
*User:iChochy
*URL:https://ichochy.com
*Copyright(c)2020
*Date:2020/09/0718:11:07
*/

packagecom.ichochy.example;

importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

publicclassRegExp{
publicstaticvoidmain(String[]args){
Stringinput="我的网站是：https://ichochy.com，你知道吗？";
//正则表达式，(.+)代表一个或多个字符
Stringregex="https://.+.com";
Patternpattern=Pattern.compile(regex);//编译表达式
Matchermatcher=pattern.matcher(input);//匹配表达式
System.out.println(matcher.find());//查找匹配返回：true
System.out.println(matcher.matches());//全文匹配返回：false
System.out.println(matcher.find());//再次查找匹配返回：false
matcher.reset();//重置匹配器
System.out.println(matcher.find());//重置查找返回：true
}
}

find方法多次调用，出现结果不相同的问题：

Thismethodstartsatthebeginningofthismatcher'sregion,or,ifapreviousinvocationofthemethodwassuccessfulandthematcherhasnotsincebeenreset,atthefirstcharacternotmatchedbythepreviousmatch.

Matcher.find方法第一次查找匹配成功后，如果Matcher没有重置(Matcher.reset())，则从上一次匹配成功位置的后面开始查找，所以会出现，再次匹配不成功，返回false。

Group分组

正则表达式通过括号分组进行匹配，matcher.group(intgroup)：通过组序号获取匹配信息

/*
*File:RegExp.java
*User:iChochy
*URL:https://ichochy.com
*Copyright(c)2020
*Date:2020/09/0718:11:07
*/

packagecom.ichochy.example;

importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

publicclassRegExp{
publicstaticvoidmain(String[]args){
Stringinput="我的网站是：https://ichochy.com，你知道吗？";
Stringregex="(https://)(.+)(.com)";//分组表达式
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(input);
if(matcher.find()){//查找匹配成功
//匹配的信息：https://ichochy.com
System.out.println(matcher.group().toString());
//groupCount组数
for(inti=0;i
正则表达式规则
字符




构造
匹配




x
字符x


\
反斜线字符


\0n
带有八进制值0的字符n(0<=n<=7)


\0nn
带有八进制值0的字符nn(0<=n<=7)


\0mnn
带有八进制值0的字符mnn（0<=m<=3、0<=n<=7）


\xhh
带有十六进制值0x的字符hh


\uhhhh
带有十六进制值0x的字符hhhh


\t
制表符('\u0009')


\n
新行（换行）符('\u000A')


\r
回车符('\u000D')


\f
换页符('\u000C')


\a
报警(bell)符('\u0007')


\e
转义符('\u001B')


\cx
对应于x的控制符




字符类




构造
匹配




[abc]
a、b或c（简单类）


[^abc]
任何字符，除了a、b或c（否定）


[a-zA-Z]
a到z或A到Z，两头的字母包括在内（范围）


[a-d[m-p]]
a到d或m到p：[a-dm-p]（并集）


[a-z&&[def]]
d、e或f（交集）


[a-z&&[^bc]]
a到z，除了b和c：[ad-z]（减去）


[a-z&&[^m-p]]
a到z，而非m到p：[a-lq-z]（减去）




预定义字符类






构造
匹配




.
任何字符（与行结束符可能匹配也可能不匹配）


\d
数字：[0-9]


\D
非数字：[^0-9]


\s
空白字符：[\t\n\x0B\f\r]


\S
非空白字符：[^\s]


\w
单词字符：[a-zA-Z_0-9]


\W
非单词字符：[^\w]




POSIX字符类（仅US-ASCII）






构造
匹配




\p{Lower}
小写字母字符：[a-z]


\p{Upper}
大写字母字符：[A-Z]


\p{ASCII}
所有ASCII：[\x00-\x7F]


\p{Alpha}
字母字符：[\p{Lower}\p{Upper}]


\p{Digit}
十进制数字：[0-9]


\p{Alnum}
字母数字字符：[\p{Alpha}\p{Digit}]


\p{Punct}
标点符号：!"#$%&'()*+,-./:;<=>?@[]^_`{|}~|


\p{Graph}
可见字符：[\p{Alnum}\p{Punct}]


\p{Print}
可打印字符：[\p{Graph}\x20]


\p{Blank}
空格或制表符：[\t]


\p{Cntrl}
控制字符：[\x00-\x1F\x7F]


\p{XDigit}
十六进制数字：[0-9a-fA-F]


\p{Space}
空白字符：[\t\n\x0B\f\r]




java.lang.Character类（简单的java字符类型）




构造
匹配




\p{javaLowerCase}
等效于java.lang.Character.isLowerCase()


\p{javaUpperCase}
等效于java.lang.Character.isUpperCase()


\p{javaWhitespace}
等效于java.lang.Character.isWhitespace()


\p{javaMirrored}
等效于java.lang.Character.isMirrored()




Unicode块和类别的类




构造
匹配




\p{InGreek}
Greek块（简单块）中的字符


\p{Lu}
大写字母（简单类别）


\p{Sc}
货币符号


\P{InGreek}
所有字符，Greek块中的除外（否定）


[\p{L}&&[^\p{Lu}]]
所有字母，大写字母除外（减去）




边界匹配器




构造
匹配




^
行的开头


$
行的结尾


\b
单词边界


\B
非单词边界


\A
输入的开头


\G
上一个匹配的结尾


\Z
输入的结尾，仅用于最后的结束符（如果有的话）


\z
输入的结尾




Greedy数量词




构造
匹配




X?
X，一次或一次也没有


X*
X，零次或多次


X+
X，一次或多次


X{n}
X，恰好n次


X{n,}
X，至少n次


X{n,m}
X，至少n次，但是不超过m次




Reluctant数量词




构造
匹配




X??
X，一次或一次也没有


X*?
X，零次或多次


X+?
X，一次或多次


X{n}?
X，恰好n次


X{n,}?
X，至少n次


X{n,m}?
X，至少n次，但是不超过m次




Possessive数量词




构造
匹配




X?+
X，一次或一次也没有


X*+
X，零次或多次


X++
X，一次或多次


X{n}+
X，恰好n次


X{n,}+
X，至少n次


X{n,m}+
X，至少n次，但是不超过m次




Logical运算符




构造
匹配




XY
X后跟Y


X
Y


(X)
X，作为捕获组




Back引用




构造
匹配




\n
任何匹配的nth捕获组




引用




构造
匹配




\
Nothing，但是引用以下字符


\Q
Nothing，但是引用所有字符，直到\E


\E
Nothing，但是结束从\Q开始的引用




特殊构造（非捕获）






构造
匹配




(?:X)
X，作为非捕获组


(?idmsux-idmsux)
Nothing，但是将匹配标志idmsuxon-off


(?idmsux-idmsux:X)
X，作为带有给定标志idmsuxon-off


(?=X)
X，通过零宽度的正lookahead


(?!X)
X，通过零宽度的负lookahead


(?<=X)
X，通过零宽度的正lookbehind


(?
X，通过零宽度的负lookbehind


(?>X)
X，作为独立的非捕获组




总结
可以看到，通过灵活的规则，设计出你想的表达式，来匹配复杂的字符串，从而快速便捷的操作。
到此这篇关于Java正则表达式实例操作的文章就介绍到这了,更多相关Java正则表达式实例内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票！
声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

构造	匹配
x	字符x
\	反斜线字符
\0n	带有八进制值0的字符n(0<=n<=7)
\0nn	带有八进制值0的字符nn(0<=n<=7)
\0mnn	带有八进制值0的字符mnn（0<=m<=3、0<=n<=7）
\xhh	带有十六进制值0x的字符hh
\uhhhh	带有十六进制值0x的字符hhhh
\t	制表符('\u0009')
\n	新行（换行）符('\u000A')
\r	回车符('\u000D')
\f	换页符('\u000C')
\a	报警(bell)符('\u0007')
\e	转义符('\u001B')
\cx	对应于x的控制符

构造	匹配
[abc]	a、b或c（简单类）
[^abc]	任何字符，除了a、b或c（否定）
[a-zA-Z]	a到z或A到Z，两头的字母包括在内（范围）
[a-d[m-p]]	a到d或m到p：[a-dm-p]（并集）
[a-z&&[def]]	d、e或f（交集）
[a-z&&[^bc]]	a到z，除了b和c：[ad-z]（减去）
[a-z&&[^m-p]]	a到z，而非m到p：[a-lq-z]（减去）

构造	匹配
.	任何字符（与行结束符可能匹配也可能不匹配）
\d	数字：[0-9]
\D	非数字：[^0-9]
\s	空白字符：[\t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	单词字符：[a-zA-Z_0-9]
\W	非单词字符：[^\w]

构造	匹配
\p{Lower}	小写字母字符：[a-z]
\p{Upper}	大写字母字符：[A-Z]
\p{ASCII}	所有ASCII：[\x00-\x7F]
\p{Alpha}	字母字符：[\p{Lower}\p{Upper}]
\p{Digit}	十进制数字：[0-9]
\p{Alnum}	字母数字字符：[\p{Alpha}\p{Digit}]
\p{Punct}	标点符号：!"#$%&'()*+,-./:;<=>?@[]^_`{\|}~\|
\p{Graph}	可见字符：[\p{Alnum}\p{Punct}]
\p{Print}	可打印字符：[\p{Graph}\x20]
\p{Blank}	空格或制表符：[\t]
\p{Cntrl}	控制字符：[\x00-\x1F\x7F]
\p{XDigit}	十六进制数字：[0-9a-fA-F]
\p{Space}	空白字符：[\t\n\x0B\f\r]

构造	匹配
\p{javaLowerCase}	等效于java.lang.Character.isLowerCase()
\p{javaUpperCase}	等效于java.lang.Character.isUpperCase()
\p{javaWhitespace}	等效于java.lang.Character.isWhitespace()
\p{javaMirrored}	等效于java.lang.Character.isMirrored()

构造	匹配
\p{InGreek}	Greek块（简单块）中的字符
\p{Lu}	大写字母（简单类别）
\p{Sc}	货币符号
\P{InGreek}	所有字符，Greek块中的除外（否定）
[\p{L}&&[^\p{Lu}]]	所有字母，大写字母除外（减去）

构造	匹配
^	行的开头
$	行的结尾
\b	单词边界
\B	非单词边界
\A	输入的开头
\G	上一个匹配的结尾
\Z	输入的结尾，仅用于最后的结束符（如果有的话）
\z	输入的结尾

构造	匹配
X?	X，一次或一次也没有
X*	X，零次或多次
X+	X，一次或多次
X{n}	X，恰好n次
X{n,}	X，至少n次
X{n,m}	X，至少n次，但是不超过m次

构造	匹配
\	Nothing，但是引用以下字符
\Q	Nothing，但是引用所有字符，直到\E
\E	Nothing，但是结束从\Q开始的引用

构造	匹配
(?:X)	X，作为非捕获组
(?idmsux-idmsux)	Nothing，但是将匹配标志idmsuxon-off
(?idmsux-idmsux:X)	X，作为带有给定标志idmsuxon-off
(?=X)	X，通过零宽度的正lookahead
(?!X)	X，通过零宽度的负lookahead
(?<=X)	X，通过零宽度的正lookbehind
(?	X，通过零宽度的负lookbehind
(?>X)	X，作为独立的非捕获组

Java正则表达式的实例操作指南

热门推荐

随机推荐