利用正则表达式将字符串分组示例代码


前言

最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:

一、实际上可以借助itertools模块的groupby()方法来处理:

import itertools 
 
Str = '122333<<<<' 
Lst = [] 
for key,group in itertools.groupby(s): 
 Lst.append(list(group)) 
 
print map(lambda x: ''.join(x), Lst) 

上面的处理,还是比较有技巧,也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点,更技巧处理方式是用正则表达式来处理:

import re 
 
Str = '122333<<<<' 
Lst = [] 
 
Pat = re.compile(r'((.)2*)') 
Rst = [x[0] for x in re.findall(Pat, Str)] 
 
print Rst 

备注:

1. (.) # .匹配任意字符;(.)做分组,方便后面反向引用

2. 2* # 2对里面括号的反向引用;*代表是0个到多个;

3. ((.)2*) # 连起来就是任意一个或多个字符组成的分组;

4. (.)1* # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对积木网的支持。

正则表达式匹配(URL、电话、手机、邮箱)的实例代码
正则表达式,又称规则表达式。(英语:RegularExpression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那

使用正则表达式验证登录页面输入是否符合要求
先给大家展示下效果图:废话不多说了,直接给大家贴代码了,具体代码如下所示:!DOCTYPEhtmlhtmlheadmetacharset="UTF-8"title/title/headscriptsrc="js/jquery-1.8.0.min.js"

关于日期正则表达式的思路详解
1概述首先需要说明的一点,无论是Winform,还是Webform,都有很成熟的日历控件,无论从易用性还是可扩展性上看,日期的选择和校验还是用日历控件来