深入浅析js中的正则表达式
阅读目录
- 正则表达式的创建
- 正则表达式中的特殊字符
- \(反斜杠)
- ^
- $
- *, +, .(小数点)
- ?(问号)
- (x)
- (?:x)
- x(?=y),x(?!y),x|y
- {n},{n,m}:
- [xyz],[^xyz]
- 其他
- 正则表达式标志
- 正则表达式使用
很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:
正则表达式的创建
两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用RegExp对象的构造函数。
两种方法的创建代码如下:
//直接创建 constregex1=/ab+c/; constregex2=/^[a-zA-Z]+[0-9]*\W?_$/gi; //调用构造函数 constregex3=newRegExp('ab+c'); constregex4=newRegExp(/^[a-zA-Z]+[0-9]*\W?_$/,"gi"); constregex5=newRegExp('^[a-zA-Z]+[0-9]*\W?_$','gi');
可以看出,调用RegExp构造函数创建正则表达式时,第一个参数可以是字符串,也可以是直接创建的正则表达式。
需要注意的是:RegExp实例继承的toLocaleString()和toString)()方法都会返回正则表达式的字面量,与创建正则表达式的方式无关
例如:
constncname='[a-zA-Z_][\\w\\-\\.]*'; constqnameCapture='((?:'+ncname+'\\:)?'+ncname+')'; conststartTagOpen=newRegExp('^<'+qnameCapture); startTagOpen.toString();//'/^<((?:[a-zA-Z_][\w\-\.]*\:)?[a-zA-Z_][\w\-\.]*)/'
正则表达式中的特殊字符
\(反斜杠)
1.在非特殊字符前加反斜杠表示下一个字符是特殊的;
2.将其后的特殊字符转译为字面量;
注意:在使用RegExp构造函数时要将\转译,因为\在字符串里也是转译字符
^
1.匹配输入的开始;
2.在[]中的第一位时表示反向字符集;
例子:
/^A/.exec('anA')//null /^A/.exec('AnE')//["A",index:0,input:"AnE"]
$
匹配输入的结束
/t$/.exec('eater')//null /t$/.exec('eat')//["t",index:2,input:"eat"] *,+,.(小数点)
*:匹配前一个表达式0次或多次。等价于{0,};
+:匹配前面一个表达式1次或者多次。等价于{1,};
.:
匹配除换行符之外的任何单个字符;
?(问号)
1.匹配前面一个表达式0次或者1次。等价于{0,1};
2.如果紧跟在任何量词*+?{}的后面,将会使量词变为非贪婪的(匹配尽量少的字符),和缺省使用的贪婪模式正好相反;
3.运用于先行断言
例子:
/\d+/.exec('123abc')//["123",index:0,input:"123abc"] /\d+?/.exec('123abc')//["1",index:0,input:"123abc"]
(x)
匹配'x'并且记住匹配项,括号表示捕获括号;
例子:
/(foo)(bar)\1\2/.test('barfoobarfoo');//false /(bar)(foo)\1\2/.test('barfoobarfoo');//true /(bar)(foo)\1\2/.test('barfoo');//false /(bar)(foo)\1\2/.test('barfoofoobar');//false /(bar)(foo)\2\1/.test('barfoofoobar');//true 'barfoobarfoo'.replace(/(bar)(foo)/,'$2$1');//"foobarbarfoo"
模式/(foo)(bar)\1\2/中的'(foo)'和'(bar)'匹配并记住字符串"foobarfoobar"中前两个单词。模式中的\1和\2匹配字符串的后两个单词。
注意:\1、\2、\n是用在正则表达式的匹配环节,在正则表达式的替换环节,则要使用像$1、$2、$n这样的语法。例如,'barfoo'.replace(/(...)(...)/,'$2$1')。
(?:x)
匹配'x'但是不记住匹配项,这种叫作非捕获括号;
例子:
'foo'.match(/foo{1,2}/)//["foo",index:0,input:"foo"] 'foo'.match(/(?:foo){1,2}/)//["foo",index:0,input:"foo"] 'foofoo'.match(/(?:foo){1,2}/)//["foofoo",index:0,input:"foofoo"] 'foofoo'.match(/foo{1,2}/)//["foo",index:0,input:"foofoo"]
使用场景:示例表达式/(?:foo){1,2}/。如果表达式是/foo{1,2}/,{1,2}将只对‘foo'的最后一个字符'o‘生效。如果使用非捕获括号,则{1,2}会匹配整个‘foo'单词。
x(?=y),x(?!y),x|y
x(?=y):匹配'x'仅仅当'x'后面跟着'y';
x(?!y):匹配'x'仅仅当'x'后面不跟着'y';
x|y:匹配x或y
这两种匹配的结果都不包含y
例子:
'JackSprat'.match(/Jack(?=Sprat)/)//["Jack",index:0,input:"JackSprat"] 'JackWprat'.match(/Jack(?=Sprat)/)//null 'JackWprat'.match(/Jack(?=Sprat|Wprat)/)//["Jack",index:0,input:"JackWprat"] /\d+(?!\.)/.exec("3.141")//["141",index:2,input:"3.141"]
{n},{n,m}:
{n}:匹配了前面一个字符刚好发生了n次;
{n,m}:匹配前面的字符至少n次,最多m次。如果n或者m的值是0,这个值被忽略;
例子:
/a{2}/.exec('candy')//null /a{2}/.exec('caandy')//["aa",index:1,input:"caandy"] /a{2}/.exec('caaandy')//["aa",index:1,input:"caaandy"] /a{1,3}/.exec('candy')//["a",index:1,input:"candy"] /a{1,3}/.exec('caandy')//["aa",index:1,input:"caandy"] /a{1,3}/.exec('caaandy')//["aaa",index:1,input:"caaandy"] /a{1,3}/.exec('caaaandy')//["aaa",index:1,input:"caaaandy"]
[xyz],[^xyz]
[xyz]:一个字符集合。匹配方括号的中任意字符;
[^xyz]:一个反向字符集。匹配任何没有包含在方括号中的字符;
这两种匹配都可以使用破折号(-)来指定一个字符范围,特殊符号在字符集中没有了特殊意义。
例:
functionescapeRegExp(string){ returnstring.replace(/([.*+?^=!:${}()|[\]\/\\])/g,"\\$&"); //$&表示整个被匹配的字符串 }
例子中的.*+?^=!:${}()都表示字面量,并没有特殊意义。
其他
\b:匹配一个词的边界。一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是0;
\B:匹配一个非单词边界;
例子:
/\bm/.exec('moon')//["m",index:0,input:"moon"] /\bm/.exec('sanmoon')//["m",index:4,input:"sanmoon"] /oo\b/.exec('moon')//null /\B../.exec('noonday')//["oo",index:1,input:"noonday"] /y\B../.exec('possiblyyesterday')///y\B../.exec('possiblyyesterday')
\d:匹配一个数字,等价于[0-9];
\D:匹配一个非数字字符,等价于[^0-9];
\f:匹配一个换页符(U+000C);
\n:匹配一个换行符(U+000A);
\r:匹配一个回车符(U+000D);
\s:匹配一个空白字符,包括空格、制表符、换页符和换行符,等价于[\f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff];
\S:匹配一个非空白字符,等价于[^\f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff];
\w:匹配一个单字字符(字母、数字或者下划线),等价于[A-Za-z0-9_];
\W:匹配一个非单字字符,等价于[^A-Za-z0-9_];
正则表达式标志
g:全局搜索;
i:不区分大小写;
m:多行搜索;
正则表达式使用
RegExp有exec()和test()方法;
exec匹配的结果为:匹配结果、捕获结果,index和input。
test匹配的结果为true或false,效率比exec要高。
String有match(),replace(),search(),split()方法;
match匹配的结果同RegExp的exec,replace根据正则表达式替换,search查找所以位置,split根据正则表达式分割字符串。
其中,当replace有function时,参数说明如下:
*匹配项
*记忆项(括号里面的项)
*...
*匹配的index
*input输入项
以上所述是小编给大家介绍的js中的正则表达式,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对毛票票网站的支持!