利用正则表达式将字符串分组示例代码

2025-05-29 0 66

前言

最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:

一、实际上可以借助itertools模块的groupby()方法来处理:

?

1

2

3

4

5

6

7

8
import itertools

Str = '122333<<<<'

Lst = []

for key,group in itertools.groupby(s):

Lst.append(list(group))

print map(lambda x: ''.join(x), Lst)

上面的处理,还是比较有技巧,也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点,更技巧处理方式是用正则表达式来处理:

?

1

2

3

4

5

6

7

8

9
import re

Str = '122333<<<<'

Lst = []

Pat = re.compile(r'((.)\\2*)')

Rst = [x[0] for x in re.findall(Pat, Str)]

print Rst

备注:

1. (.) # .匹配任意字符;(.)做分组,方便后面反向引用

2. \\2* # \\2对里面括号的反向引用;*代表是0个到多个;

3. ((.)\\2*) # 连起来就是任意一个或多个字符组成的分组

4. (.)\\1* # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对快网idc的支持。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

快网idc优惠网 建站教程 利用正则表达式将字符串分组示例代码 https://www.kuaiidc.com/88568.html

相关文章

发表评论
暂无评论