Python文件路径模式匹配glob模块使用详解

 更新时间:2025年04月18日 09:38:44   作者:tekin  
这篇文章主要介绍了Python文件路径模式匹配glob模块使用的相关资料,glob模块是Python中用于文件和目录查找的工具,支持使用通配符进行模糊匹配,它可以处理简单的文件名模式,并通过glob和iglob两个函数实现文件路径的模式匹配,需要的朋友可以参考下

一、glob 模块概述

glob 模块可根据指定的模式来查找文件和目录,它支持使用通配符进行模糊匹配。主要通过 glob 和 iglob 两个函数来实现文件路径的模式匹配,能处理简单的文件名模式,如 *.txt 可匹配所有扩展名为 .txt 的文件。

二、通配符规则

(一)* 通配符

  • 功能:匹配任意数量(包括零个)的任意字符。
  • 示例
import glob

# 匹配当前目录下所有扩展名为 .txt 的文件
txt_files = glob.glob('*.txt')
for file in txt_files:
    print(file)

上述代码中,*.txt 表示匹配当前目录下文件名任意,但扩展名为 .txt 的所有文件。

(二)? 通配符

  • 功能:匹配单个任意字符。
  • 示例
import glob

# 匹配当前目录下文件名只有一个字符且扩展名为 .py 的文件
single_char_py_files = glob.glob('?.py')
for file in single_char_py_files:
    print(file)

这里,?.py 表示文件名只有一个字符,扩展名为 .py 的文件。

(三)[] 通配符

  • 功能:匹配方括号内指定的任意一个字符。

  • 示例

import glob

# 匹配当前目录下文件名以 a 或 b 开头且扩展名为 .txt 的文件
ab_txt_files = glob.glob('[ab]*.txt')
for file in ab_txt_files:
    print(file)

[ab]*.txt 表示文件名以 a 或 b 开头,扩展名为 .txt 的文件。

(四)** 通配符(递归匹配)

  • 功能:在路径中使用 ** 表示递归匹配目录。在 Python 3.5 及以上版本支持。
  • 示例
import glob

# 递归匹配当前目录及其子目录下所有扩展名为 .txt 的文件
all_txt_files = glob.glob('**/*.txt', recursive=True)
for file in all_txt_files:
    print(file)

**/*.txt 结合 recursive=True 会递归查找当前目录及其所有子目录下的 .txt 文件。

三、glob 函数

(一)glob.glob(pathname, *, recursive=False)

  • 功能:返回一个符合指定模式的文件和目录路径列表。

  • 参数:

    • pathname:要匹配的路径模式。
    • recursive:是否进行递归匹配,默认为 False。当设置为 True 时,支持使用 ** 通配符进行递归查找。
  • 示例

import glob

# 匹配当前目录及其子目录下所有以 test 开头的文件
test_files = glob.glob('**/test*', recursive=True)
for file in test_files:
    print(file)

四、iglob 函数

(一)glob.iglob(pathname, *, recursive=False)

  • 功能:返回一个迭代器,该迭代器会逐个产生符合指定模式的文件和目录路径。
  • 参数:与 glob.glob 相同。
  • 示例
import glob

# 使用 iglob 迭代匹配当前目录下所有 .py 文件
py_files_iter = glob.iglob('*.py')
for file in py_files_iter:
    print(file)

iglob 适合处理大量匹配结果的情况,因为它不会一次性生成所有匹配结果,而是逐个产生,节省内存。

五、glob 与其他文件查找方式的对比

查找方式优点缺点适用场景
glob 模块使用简单,支持通配符匹配,能快速查找符合模式的文件和目录。模式匹配功能相对简单,不支持复杂的正则表达式匹配。简单的文件和目录查找,如按扩展名、文件名前缀等查找。
os.walk 函数可以递归遍历目录树,能详细控制遍历过程。需要手动编写代码进行文件筛选,使用相对复杂。需要对目录树进行深度遍历和复杂筛选的场景。
re 模块(正则表达式)支持复杂的模式匹配,功能强大。学习成本较高,代码相对复杂。需要进行复杂文件名模式匹配的场景。

六、应用场景

(一)批量文件处理

可以使用 glob 模块查找符合特定模式的文件,然后对这些文件进行批量处理,如批量重命名、批量读取文件内容等。

import glob

# 批量重命名当前目录下所有 .txt 文件
txt_files = glob.glob('*.txt')
for file in txt_files:
    new_name = file.replace('.txt', '_new.txt')
    import os
    os.rename(file, new_name)

(二)数据收集

在进行数据收集时,可能需要从多个文件中读取数据。可以使用 glob 模块查找相关文件,然后读取数据。

import glob

# 读取当前目录及其子目录下所有 .csv 文件的数据
csv_files = glob.glob('**/*.csv', recursive=True)
for file in csv_files:
    with open(file, 'r') as f:
        data = f.read()
        print(f"Data from {file}: {data[:100]}...")

文章总结

glob 模块为 Python 开发者提供了一种便捷的文件和目录查找方式,通过使用 Unix 风格的通配符规则,能快速定位符合特定模式的文件和目录。glob.glob 函数返回匹配结果列表,glob.iglob 函数返回迭代器,适用于不同的应用场景。在简单的文件查找和批量处理任务中,glob 模块是一个非常实用的工具。

到此这篇关于Python文件路径模式匹配glob模块使用的文章就介绍到这了,更多相关Python文件路径模式匹配glob模块内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django实现自定义404,500页面教程

    Django实现自定义404,500页面教程

    这篇文章主要介绍了Django实现自定义404,500页面的详细方法,非常简单实用,有需要的小伙伴可以参考下
    2017-03-03
  • python利用ddddocr包ocr识别图片码的实现

    python利用ddddocr包ocr识别图片码的实现

    ddddocr是一个轻量级的OCR库,用于识别图片中的文字和验证码,本文主要介绍了python利用ddddocr包ocr识别图片码的实现,具有一定的参考价值,感兴趣的可以了解一下
    2025-01-01
  • 调整Jupyter notebook的启动目录操作

    调整Jupyter notebook的启动目录操作

    这篇文章主要介绍了调整Jupyter notebook的启动目录操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python轻松获取网络时间和本地时间技巧揭秘

    Python轻松获取网络时间和本地时间技巧揭秘

    这篇文章主要为大家介绍了Python轻松获取网络时间和本地时间技巧揭秘,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • python学生管理系统

    python学生管理系统

    这篇文章主要为大家详细介绍了python学生管理系统的相关代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • 关于python pycharm中输出的内容不全的解决办法

    关于python pycharm中输出的内容不全的解决办法

    这篇文章主要介绍了关于python pycharm中输出的内容不全的解决办法,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-01-01
  • PyCharm配置anaconda环境的步骤详解

    PyCharm配置anaconda环境的步骤详解

    PyCharm是一款很好用很流行的python编辑器。Anaconda通过管理工具包、开发环境、Python版本,大大简化了你的工作流程。今天通过本文给大家分享PyCharm配置anaconda环境,感兴趣的朋友一起看看吧
    2020-07-07
  • 浅谈Python之Django(二)

    浅谈Python之Django(二)

    这篇文章主要介绍了Python3中的Django,小编觉得这篇文章写的还不错,需要的朋友们下面随着小编来一起学习学习吧,希望能够给你带来帮助
    2021-10-10
  • python生成日历实例解析

    python生成日历实例解析

    这篇文章主要介绍了python生成日历的方法,实用了python自带的 calendar模块加以实现,需要的朋友可以参考下
    2014-08-08
  • python 基于aiohttp的异步爬虫实战详解

    python 基于aiohttp的异步爬虫实战详解

    这篇文章主要为大家介绍了python 基于aiohttp的异步爬虫实战详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-09-09

最新评论