Python正则表达re模块之findall()函数详解

 更新时间:2022年07月07日 09:38:19   作者:向阳树  
在python中,通过内嵌集成re模块可以直接调用来实现正则匹配,其中re.findall()函数可以遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表,这篇文章主要给大家介绍了关于Python正则表达re模块之findall()函数的相关资料,需要的朋友可以参考下

一、re.findall函数介绍

它在re.py中有定义:

def findall(pattern, string, flags=0):
    """Return a list of all non-overlapping matches in the string.

    If one or more capturing groups are present in the pattern, return
    a list of groups; this will be a list of tuples if the pattern
    has more than one group.

    Empty matches are included in the result."""

    return _compile(pattern, flags).findall(string)

返回string中所有与pattern匹配的全部字符串,返回形式为数组。

findall()函数的两种表示形式

import re
kk = re.compile(r'\d+')
kk.findall('one1two2three3four4')
#[1,2,3,4]
 
#注意此处findall()的用法,可传两个参数;
kk = re.compile(r'\d+')
re.findall(kk,"one123")
#[1,2,3]

二、实例代码

后面会讲解代码里的各个部分,先列出来~

import re
 
str = 'aabbabaabbaa'

# 一个"."就是匹配除 \n (换行符)以外的任意一个字符
print(re.findall(r'a.b',str))#['aab', 'aab']

# *前面的字符出现0次或以上
print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']

# 贪婪,匹配从.*前面为开始到后面为结束的所有内容
print(re.findall(r'a.*b',str))#['aabbabaabb']

# 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

# 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容
print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
 
str = '''aabbab
         aabbaa
         bb'''     #后面多加了2个b

# 没有把最后一个换行的aab算进来
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

# re.S不会对\n进行中断
print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n         b']

三、re.findall中正则表达式(.*?)

字符串是

str = 'aabbabaabbaa'

1. 符号 . 就 是匹配除 \n (换行符)以外的任意一个字符

print(re.findall(r'a.b',str))
#['aab', 'aab']

2.符号 * 前面的字符出现0次或以上

print(re.findall(r'a*b',str))
#['aab', 'b', 'ab', 'aab', 'b']

3.符号.* 贪婪,匹配从.*前面为开始到后面为结束的所有内容

print(re.findall(r'a.*b',str))
#['aabbabaabb']

4.符号.*? 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

5.符号(.*?) 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容

print(re.findall(r'a(.*?)b',str))
#['a', '', 'a']

关于带括号与不带括号的区别

import re

string="abcdefg  acbdgef  abcdgfe  cadbgfe"

#不带括号
regex=re.compile("((\w+)\s+\w+)")
print(regex.findall(string))
#输出:[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]

regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(string))
#输出:['abcdefg', 'abcdgfe']

regex2=re.compile("\w+\s+\w+")
print(regex2.findall(string))
#输出:['abcdefg  acbdgef', 'abcdgfe  cadbgfe']
  • 第一个 regex 中带有2个括号,其输出list 中包含2个 tuple
  • 第二个 regex 中带有1个括号,其输出内容是括号匹配到的内容,而不是整个表达式所匹配到的结果。
  • 第三个 regex 中不带括号,其输出的内容就是整个表达式所匹配到的内容。

实际上这并不是python特有的,这是正则所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 "()" 代表的是分组的意思,一个括号代表一个分组,你只能匹配到 "()" 中的内容。

四、re.findall中参数re.S的意义

1.字符串变为(后面多加了2个b)

str = '''aabbab
         aabbaa
         bb'''

2.参数无re.S,没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

3.参数有re.S,不会对\n进行中断

print(re.findall(r'a.*?b',str,re.S))
#['aab', 'ab', 'aab', 'aa\n         b']

参考

2. python re模块findall()详解

3. Python 正则re模块之findall()详解

总结

到此这篇关于Python正则表达re模块之findall()函数详解的文章就介绍到这了,更多相关Python正则表达re模块findall()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python按比例随机切分数据的实现

    python按比例随机切分数据的实现

    这篇文章主要介绍了python按比例随机切分数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • python实现八大排序算法(1)

    python实现八大排序算法(1)

    这篇文章主要为大家详细介绍了python实现八大排序算法的第一篇,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-09-09
  • python中列表和元组的区别

    python中列表和元组的区别

    给大家详细讲解了python中列表和元组的区别,需要的朋友参考一下。
    2017-12-12
  • Python自定义装饰器原理与用法实例分析

    Python自定义装饰器原理与用法实例分析

    这篇文章主要介绍了Python自定义装饰器原理与用法,结合实例形式较为详细的分析了Python自定义装饰器,带参数的装饰器等概念、原理、实现方法及相关使用技巧,需要的朋友可以参考下
    2018-07-07
  • 使用Django的模版来配合字符串翻译工作

    使用Django的模版来配合字符串翻译工作

    这篇文章主要介绍了使用Django的模版来配合字符串翻译工作,Django是最具人气的Python开发框架,需要的朋友可以参考下
    2015-07-07
  • 基于python cut和qcut的用法及区别详解

    基于python cut和qcut的用法及区别详解

    今天小编就为大家分享一篇基于python cut和qcut的用法及区别详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • Python操作word文档插入图片和表格的实例演示

    Python操作word文档插入图片和表格的实例演示

    这篇文章主要给大家介绍了关于Python操作word文档插入图片和表格的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • Python多线程:主线程等待所有子线程结束代码

    Python多线程:主线程等待所有子线程结束代码

    这篇文章主要介绍了Python多线程:主线程等待所有子线程结束代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python执行等待程序直到第二天零点的方法

    python执行等待程序直到第二天零点的方法

    这篇文章主要介绍了python执行等待程序直到第二天零点的方法,涉及Python等待程序的实现技巧,需要的朋友可以参考下
    2015-04-04
  • Django choices下拉列表绑定实例

    Django choices下拉列表绑定实例

    这篇文章主要介绍了Django choices下拉列表绑定实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03

最新评论