利用正则表达式将字符串分组示例代码
前言
最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1','22','333','<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:
一、实际上可以借助itertools模块的groupby()方法来处理:
importitertools Str='122333<<<<' Lst=[] forkey,groupinitertools.groupby(s): Lst.append(list(group)) printmap(lambdax:''.join(x),Lst)
上面的处理,还是比较有技巧,也能得到想要的输出结果
['1','22','333','<<<<']
二、但更酷点,更技巧处理方式是用正则表达式来处理:
importre Str='122333<<<<' Lst=[] Pat=re.compile(r'((.)\2*)') Rst=[x[0]forxinre.findall(Pat,Str)] printRst
备注:
1.(.) #.匹配任意字符;(.)做分组,方便后面反向引用
2.\2* #\2对里面括号的反向引用;*代表是0个到多个;
3.((.)\2*) #连起来就是任意一个或多个字符组成的分组;
4.(.)\1* #这种方式则可以取出唯一的值['1','2','3','<'];同样非常方便
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对毛票票的支持。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。