Python正则表达式语法及re模块中的常用函数详解

 更新时间:2025年04月24日 11:07:27   作者:是十一月末  
这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、查找和替换等操作,文章详细讲解了如何使用正则表达式进行匹配,,需要的朋友可以参考下

概念、作用和步骤

概念: 本身也是一个字符串,其中的字符具有特殊含义,将来我们可以根据这个字符串【正则表达式】去处理其他的字符串,比如可以对其他字符串进行匹配,切分,查找,替换等一系列操作。

作用:可以对其他字符串进行匹配,切分,查找,替换等处理操作。

编写的步骤:- 需要大量的文本信息——找规律——使用正则语法编写出正则表达式

是一个独立于任何一门语言的技术,任何一门语言中都可以使用同一个正则表达式去操作

语法

需要先导入内置函数re,import re

  • 字符串本身就是一个正则表达式
  • [] 表示可选项

代码展示:

import re
s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,邮箱是12345678@qq.com和12134.163.com。希望我的三个快递能找到'
r1 = re.findall(r'\d+[16]',s1)
print(r1,type(r1))

运行结果:

  • 英文字母范围
    • [a-z] 表示查找 a-z
    • [A-Za-z]
    • [0-9]

注意[]需要用’ '括起才能使用,否则报错
[**A-Za-z]不能改变如[A-z]因为使用的是ASCII码,会出现非英文部分。

代码展示:

s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'[f-z]',s1)
r2 = re.findall(r'[A-Za-z]',s1)
r3 = re.findall(r'[3-9]',s1)
print(r1)
print(r2)
print(r3)

运行结果:

  • \d 数字
    • **\d?**表示出现了0次或者1次
    • \d+ 表示出现了1次或者n次
    • \d*表示出现了0次或者n次

    \d同时需’'括起使用

代码展示:

s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'\d',s1)
r4 = re.findall(r'\d?',s1)
r2 = re.findall(r'\d+',s1)
r3 = re.findall(r'\d*',s1)
print(r1)
print(r4)
print(r2)
print(r3)

运行结果:

  • {}出现次数
    • {m,n} 表示出现的次数范围,m表示至少出现的次数,n表述最多出现的次数
    • {m,} 表示出现的次数,至少为m个,上不封顶
    • {m} 表示出现了m次

代码展示:

s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,微信是微信2342345,qq是qq1234,邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'1\d{1,2}',s1)
r2 = re.findall(r'是\d{,2}',s1)
r4 = re.findall(r'1\d{3,}',s1)
r3 = re.findall(r'\d{2}',s1)
print(r1)
print(r2)
print(r4)
print(r3)

运行结果:

  • \w 表示英文字母大写或者小写,或者下划线,或者是中文汉字
  • \W 表示除了大小写英文字母,数字,汉字,下划线之外,都能匹配

如果我们没有写re.ASCII参数,那么第一个\w+会将汉字也匹配上,因为\w本身就可以匹配汉字的,但是当我们加上了re.ASCII参数,python正则表达式匹配的时候,\w只会匹配ASCII码上有的字符。

代码展示:

s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,微信是微信2342345,qq是qq1234,邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'\W',s1)
r2 = re.findall(r'qq\w+',s1)
r3 = re.findall(r'qq\w+',s1,re.ASCII)
print(r1)
print(r2)
print(r3)

运行结果:

  • 匹配以某个字符串开头

    • ^ 表示以某个字符串开头

.com在re里可写成\.com

代码展示:

s1 = '今天是个好天气,我的快递1-67,12-21343,ert_134找不到了,手机号码是12345685769,微信是wx2342345,qq是qq1234,邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'qq\w+',s1,re.ASCII)
r2 = re.findall(r'12\w+\@\w+\.com',s1,re.ASCII)
s2 = '123ajdhsa2134'
s3 = 'ajdhsa$2134$'
r3 = re.findall(r'^aj',s2,re.ASCII)
r4 = re.findall(r'^aj',s3,re.ASCII)
print(r1)
print(r2)
print(r3)
print(r4)

运行结果:

  • () 分组

可以
多个()进行分组,,结果按()顺序
代码展示:

s1 = '身份证号:342300200105198866'
r1 = re.findall(r'(342\d{3}(\d{4})(\d{4}))',s1,re.ASCII)
print(r1)
for i in r1:
    print(i)

运行结果:

  • 或 | 多个字符之间的或使用小括号

代码展示:

s1 = '身份证号1:342300200105198866,另一个身份证号2:342200200806116688'
r1 = re.findall(r'(342\d{3}(\d{4})(\d{4}))',s1)
r2 = re.findall(r'(342(300|200)(\d{4})(\d{2})(\d{2}))',s1)
print(r1)
print(r2)

运行结果:

  • . 表示任意字符

使用\转义字符,将.变成普通的点字符进行匹配

代码展示:

s1 = '今天天气正好,适合买xiaomipro,邮箱是12345678@qq.com'
r1 = re.findall(r'xiao.{5}',s1)
r2 = re.findall(r'天气.{5}',s1)
r3 = re.findall(r'12\d+@+\w+\.com',s1)

print(r1)
print(r2)
print(r3)

运行结果:

re模块中的常用函数

  • re.findall 在大字符串中查找符合正则表达式特点的式子
  • re.match() 匹配整个字符串是否符合某个正则表达式特点
  • re.search() 从左向右匹配正则表达式,只会匹配一次符合条件, 得到的是一个对象

match和search返回的是对象,需要group查看

代码展示:

s1 = '今天天气正好,适合买xiaomipro,邮箱是12345678@qq.com'
s2 = 'xiaom'
r1 = re.findall(r'xiao.{5}',s1)
r2 = re.match(r'xiao',s2)
r3 = re.match(r'xiao',s1)
r4 = re.search(r'xiao',s2)
print(r1)
print(r2)
print(r2.group())
print(r3)
print(r4)
print(r4.group())

运行结果:

  • re.split()切割

代码展示:

s1 = 'xiaomi.pro@12345'
r1 = re.split(r'[.,@]',s1)
print(r1)

运行结果:

  • re.finditer() 在大字符串中查找符合正则表达式特点的式子,得到的是一个迭代器
    代码展示:
s1 = 'xiaomi.pro@12345'
r1 = re.finditer(r'[(\d+)]',s1,re.ASCII)
for i in r1:
    print(i.group())
print(r1)

运行结果:

  • fullmatch() 将字符串整体与正则表达式进行匹配

代码展示:

text = '安徽省-合肥市'
res1 = re.fullmatch(f'(\w+)-(\w+)', text)
print(f"省份:{res1.group(1)}")
print(f"市:{res1.group(2)}")

运行结果:

总结 

到此这篇关于Python正则表达式语法及re模块中的常用函数的文章就介绍到这了,更多相关Python正则及re模块函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 深入理解python中的浅拷贝和深拷贝

    深入理解python中的浅拷贝和深拷贝

    下面小编就为大家带来一篇深入理解python中的浅拷贝和深拷贝。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-05-05
  • 利用PyCharm Profile分析异步爬虫效率详解

    利用PyCharm Profile分析异步爬虫效率详解

    这篇文章主要给大家介绍了关于如何利用PyCharm Profile分析异步爬虫效率的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用PyCharm具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • PyCharm提示No Python Interpreter的正确解决办法

    PyCharm提示No Python Interpreter的正确解决办法

    刚学Python时,拿到一个Python项目,想用pycharm打开运行却报错了,这篇文章主要给大家介绍了关于PyCharm提示No Python Interpreter的正确解决办法,需要的朋友可以参考下
    2023-10-10
  • python下载库的步骤方法

    python下载库的步骤方法

    在本篇文章里小编给大家分享的是关于python怎么下载库的详细实例内容,有需要的朋友们学习下。
    2019-10-10
  • Python 判断图像是否读取成功的方法

    Python 判断图像是否读取成功的方法

    今天小编就为大家分享一篇Python 判断图像是否读取成功的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python趣味挑战之pygame实现无敌好看的百叶窗动态效果

    Python趣味挑战之pygame实现无敌好看的百叶窗动态效果

    最近写了很多期关于pygame的案例和知识点,自己也收获了很多知识,也在这个过程中成长了不少, 这次还是围绕surface对象进行详细介绍,并形成完整的案例过程,文中有非常详细实现百叶窗动态效果的代码示例,需要的朋友可以参考下
    2021-05-05
  • Python自动删除过期文件的实现方法

    Python自动删除过期文件的实现方法

    你是否感到你的电脑越用越卡,启动程序慢,打开文件也慢?罪魁祸首可能就是那些不知不觉中文件堆积如山的文件夹!下载的电影、浏览网页产生的临时文件、旧的程序日志、一次性使用的文档,本文我们将手把手教你如何打造一套Python自动删除过期文件的智能系统
    2025-11-11
  • 使用python绘制温度变化雷达图

    使用python绘制温度变化雷达图

    这篇文章主要为大家介绍了使用python绘制温度变化雷达图,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • Numpy 多维数据数组的实现

    Numpy 多维数据数组的实现

    这篇文章主要介绍了Numpy 多维数据数组的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-06-06
  • Python还能这么玩之只用30行代码从excel提取个人值班表

    Python还能这么玩之只用30行代码从excel提取个人值班表

    公司实行项目值班制度,拿到值班表,看到全部的值班信息,要去查找自己的值班信息,是一件头痛的事情.作为程序员,当然要简化,将自己的信息提炼出来,需要的朋友可以参考下
    2021-06-06

最新评论