python re正则表达式模块(Regular Expression)

更新时间：2014年07月16日 09:42:59 投稿：hebedich

Python 的 re 模块（Regular Expression 正则表达式）提供各种正则表达式的匹配操作，在文本解析、复杂字符串分析和信息提取时是一个非常有用的工具.

模块的的作用主要是用于字符串和文本处理，查找，搜索，替换等

复习一下基本的正则表达式吧

.：匹配除了换行符以为的任意单个字符

*：匹配任意字符，一个，零个，多个都能匹配得到俗称贪婪模式

+：匹配位于+之前的一个或者多个字符

|：匹配位于|之前或者之后的字符

^：匹配行首

$：匹配行尾

?：匹配位于？之前的零个或者一个字符，不匹配多个字符

\：表示 \ 之后的为转义字符

[]：匹配[]之中的任意单个字符,[0-9]表示匹配0到9任意一个数字

()：将位于()之内的的内容当作一个整体

{}：按{}中的次数进行匹配，100[0-9]{3}表示在100之后任意匹配一个3位数（100-999）

python中以\开头的元字符：

特殊序列符号	意义
\A	只在字符串开始进行匹配
\Z	只在字符串结尾进行匹配
\b	匹配位于开始或结尾的空字符串
\B	匹配不位于开始或结尾的空字符串
\d	相当于[0-9]
\D	相当于[^0-9]
\s	匹配任意空白字符:[\t\n\r\r\v]
\S	匹配任意非空白字符:[^\t\n\r\r\v]
\w	匹配任意数字和字母:[a-zA-Z0-9]
\W	匹配任意非数字和字母:[^a-zA-Z0-9]

正则表达式语法表

语法	意义	说明
"."	任意字符
"^"	字符串开始	'^hello'匹配'helloworld'而不匹配'aaaahellobbb'
"$"	字符串结尾	与上同理
"*"	0 个或多个字符（贪婪匹配）	<*>匹配<title>chinaunix</title>
"+"	1 个或多个字符（贪婪匹配）	与上同理
"?"	0 个或多个字符（贪婪匹配）	与上同理
*?,+?,??	以上三个取第一个匹配结果（非贪婪匹配）	<*>匹配<title>
{m,n}	对于前一个字符重复m到n次，{m}亦可	a{6}匹配6个a、a{2,4}匹配2到4个a
{m,n}?	对于前一个字符重复m到n次，并取尽可能少	‘aaaaaa'中a{2,4}只会匹配2个
"\\"	特殊字符转义或者特殊序列
[]	表示一个字符集	[0-9]、[a-z]、[A-Z]、[^0]
"\|"	或	A\|B,或运算
(...)	匹配括号中任意表达式
(?#...)	注释，可忽略
(?=...)	Matches if ... matches next, but doesn't consume the string.	'(?=test)' 在hellotest中匹配hello
(?!...)	Matches if ... doesn't match next.	'(?!=test)' 若hello后面不为test，匹配hello
(?<=...)	Matches if preceded by ... (must be fixed length).	'(?<=hello)test' 在hellotest中匹配test
(?<!...)	Matches if not preceded by ... (must be fixed length).	'(?<!hello)test' 在hellotest中不匹配test

匹配的标志和含义

标志	含义
re.I	忽略大小写
re.L	根据本地设置而更改\w,\W,\b,\B,\s,\S的匹配内容
re.M	多行匹配模式
re.S	使“.”元字符匹配换行符
re.U	匹配Unicode字符
re.X	忽略需要匹配模式中的空格，并且可以使用"#"号注释

文本内容（提取Linux下的password文件）

man:x:6:12:man:/var/cache/man:/bin/nologin

re模块中有３个搜索函数，每个函数都接受３个参数(匹配模式，要匹配的字符串，进行匹配的标志)，如果匹配到了就返回一个对象实例，么有就返会Ｎone．

findall():用于在字符串中查找符合正则表达式的字符串，并返回这些字符串的列表

search():搜索整个字符串，返回对象实例

match():只从第一个字符开始匹配，后面的不再匹配，返回对象实例

lovelinux@LoveLinux:~/py/boke$ cat text 
man:x:6:12:man:/var/cache/man:/bin/sh
lovelinux@LoveLinux:~/py/boke$ cat test.py
#/usr/bin/env python
#coding:utf-8
import re
with open('text','r') as txt:
 f = txt.read()
 print re.match('bin',f)
 print re.search('bin',f).end() 
lovelinux@LoveLinux:~/py/boke$ python test.py 
None
34
lovelinux@LoveLinux:~/py/boke$ vim test.py
lovelinux@LoveLinux:~/py/boke$ python test.py 
None
<_sre.SRE_Match object at 0x7f12fc9f9ed0>

返回是对象实例有２个方法，

start()：返回记录匹配到字符的开始索引　

end()：返回记录匹配到字符的结束索引

lovelinux@LoveLinux:~/py/boke$ python test.py 
None
31
34
lovelinux@LoveLinux:~/py/boke$ cat test.py 
#/usr/bin/env python
#coding:utf-8
import re
with open('text','r') as txt:
 f = txt.read()
 print re.match('bin',f)
 print re.search('bin',f).start()
 print re.search('bin',f).end()

您可能感兴趣的文章:

Python中yield函数的用法详解
这篇文章详细介绍了Python中的yield关键字及其用法,yield关键字用于生成器函数中,使得函数可以像迭代器一样工作,但不会一次性将所有结果加载到内存中,文中将用法介绍的非常详细,需要的朋友可以参考下
2025-03-03
Python缓存方案优化程序性能提高数据访问速度
Python缓存方案是一种优化程序性能，提高数据访问速度的方案。通过缓存数据，可以减少重复的计算和IO操作，从而提高程序的运行效率。Python中常用的缓存方案包括内存缓存、磁盘缓存和分布式缓存等，根据实际需求选择不同的方案可以帮助我们更好地优化程序性能
2023-05-05
Django REST framework 如何实现内置访问频率控制
这篇文章主要介绍了Django REST framework 内置访问频率控制,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
python目标检测非极大抑制NMS与Soft-NMS
这篇文章主要weidajia 介绍了python目标检测非极大抑制NMS与Soft-NMS实现过程，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-05-05
pycharm部署django项目到云服务器的详细流程
今天重点给大家介绍pycharm部署django项目到云服务器的详细流程，首先大家需要先下载python3.8压缩包，然后通过一系列命令完成操作，具体实现方法，跟随小编一起看看吧
2021-06-06
Python ftp上传文件
这篇文章主要介绍了Python ftp上传文件的相关资料,需要的朋友可以参考下
2016-02-02
python实现梯度法 python最速下降法
这篇文章主要为大家详细介绍了python梯度法，最速下降法的原理，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-03-03
matplotlib.pyplot.matshow 矩阵可视化实例
这篇文章主要介绍了matplotlib.pyplot.matshow 矩阵可视化实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
python plt如何保存为emf图像
这篇文章主要介绍了python plt如何保存为emf图像问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-09-09
Python中eval函数的表达式作用示例
这篇文章主要介绍了Python中eval函数的表达式用法示例，文中通过示例对比来为大家进行详细的讲解，有需要的朋友可以借鉴参下，希望有所帮助
2021-09-09

python re正则表达式模块(Regular Expression)

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具