JavaScript 正则命名分组【推荐】
前言
以往我们只是习惯于通过数组下标来访问正则匹配到的分组,但分组达到4、5个时,标识起来就会非常麻烦。V8早已实现了正则命名分组提案,只是我们很少使用,本文将介绍JS的正则命名分组。
以往的做法
假设要使用正则匹配一个日期的年月日,以往我们会这样做:
constRE_DATE=/(\d{4})-(\d{2})-(\d{2})/; constmatchObj=RE_DATE.exec('1999-12-31'); constyear=matchObj[1];//1999 constmonth=matchObj[2];//12 constday=matchObj[3];//31
这里有几个缺点:
- 要找到一个分组的位置,你必须要去数括号的位置,有时嵌套起来会更令人头疼。
- 后面维护代码的同学阅读起来,还要根据下标找到正则里面对应的括号,并且要再次阅读括号里面的正则才知道含义。
- 当你调整正则捕获分组的数量、顺序或嵌套时,你必要还要对下面的代码做调整。
所有这些问题,都可以通过正则命名分组来解决。
现在的玩法
现在你只需要给分组里面一个命名标识即可:
(?
这里,我们用变量year标记了上一个捕获组#1。该名称必须是合法的JavaScript标识符。匹配后,您可以通过matchObj.groups.year访问捕获的字符串。
让我们通过命名分组重写前面的代码:
constRE_DATE=/(?\d{4})-(? \d{2})-(? \d{2})/; constmatchObj=RE_DATE.exec('1999-12-31'); constyear=matchObj.groups.year;//1999 constmonth=matchObj.groups.month;//12 constday=matchObj.groups.day;//31
如果正则里面有了命名分组,那么匹配结果会多了一个groups的属性,这个属性中包含了一切命名分组的捕获结果。配合上解构大法使用又是一股清流:
const{groups:{day,year}}=RE_DATE.exec('1999-12-31'); console.log(year);//1999 console.log(day);//31
当然,即使你使用了命名分组,那么返回的结果还可以通过以往的数组下标方式访问:
constyear2=matchObj[1];//1999 constmonth2=matchObj[2];//12 constday2=matchObj[3];//31
命名分组具有以下优点:
- 找到分组的“ID”更容易。
- 匹配的代码变得自描述性,因为分组的ID描述了捕获的内容。
- 如果更改分组的顺序,则不必更改匹配的代码。
- 分组的名称也使正则表达式更易于理解,因为您可以直接看到每个组的用途。
反向引用
反向引用命名分组\k
看下面这个匹配重复单词的例子:
constRE_TWICE=/^(?[a-z]+)!\k $/; RE_TWICE.test('abc!abc');//true RE_TWICE.test('abc!ab');//false
同时也可以使用以往的反向引用方式:
constRE_TWICE=/^(?[a-z]+)!\1$/; RE_TWICE.test('abc!abc');//true RE_TWICE.test('abc!ab');//false
replace()
字符串方法replace()以两种方式支持命名分组:
方式一
constRE_DATE=/(?\d{4})-(? \d{2})-(? \d{2})/; console.log('1999-12-31'.replace(RE_DATE, '$ /$ /$ ')); //12/31/1999
如果replace不一定是直接返回新的拼接字符串,那么可以看看下面的办法:
方式二
constRE_DATE=/(?\d{4})-(? \d{2})-(? \d{2})/; console.log('1999-12-31'.replace( RE_DATE, (g,y,m,d,offset,input,{year,month,day})=> month+'/'+day+'/'+year)); //12/31/1999
看看这replace的callback形参密密麻麻看得心慌慌,很多都用不上,那么我们看看更简单的写法:
console.log('1999-12-31'.replace(RE_DATE, (...args)=>{ const{year,month,day}=args.slice(-1)[0]; returnmonth+'/'+day+'/'+year; })); //12/31/1999
这里配合上spreadoperator直取最后一个参数,再接上一个解构大法,结果又是一股清流。
命名分组没有匹配结果?
如果可选的命名组不被匹配,则其属性值被设置为undefined,但key是仍存在:
constRE_OPT_A=/^(?a+)?$/; constmatchObj=RE_OPT_A.exec(''); //Wehaveamatch: console.log(matchObj[0]==='');//true //Group didn'tmatchanything: console.log(matchObj.groups.as===undefined);//true //Butpropertyasexists: console.log('as'inmatchObj.groups);//true
异常情况
分组名不能有重复项:
/(?a)(? b)///SyntaxError:Duplicatecapturegroupname
反向引用一个不存在的分组名:
/\k/u//SyntaxError:Invalidnamedcapturereferenced /\k /.test("k ")//true,非Unicode下为了向后兼容,k前面的\会被丢弃
在reaplce()方法的替换字符串中引用一个不存在的分组:
"abc".replace(/(?.*)/,"$ ")//SyntaxError:Invalidreplacementstring "abc".replace(/(.*)/,"$ ")//"$ ",不包含命名分组时会向后兼容
最后
- Chrome60已支持命名分组
- 通过babel插件处理兼容问题
babel-plugin-transform-modern-regexp
总结
以上所述是小编给大家介绍的JavaScript正则命名分组,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对毛票票网站的支持!