简单掌握Python中glob模块查找文件路径的用法

 更新时间:2016年07月05日 17:59:25   作者:lucifercn  
glob模块遵循Unix的shell规则来匹配文件名进行文件查找,下面我们结合匹配相关的字符区间与通配符知识,来简单掌握Python中glob模块查找文件路径的用法

glob使用UNIX shell规则查找与一个模式匹配的文件名。只要程序需要查找文件系统中名字与某个模式匹配的一组文件,就可以使用这个模块。
glob的模式规则与re模块使用的正则表达式不相同。glob模式遵循标准UNIX路径扩展规则。只是用几个特殊字符来实现两个不同的通配符和字符区间。模式规则要应用于文件名中的段。模式中的路径可以是相对路径或绝对路径。
shell变量名和波浪线都不会扩展。

基本用法

1.glob.glob(pathname), 返回所有匹配的文件路径列表。它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。
2.glob.iglob(pathname), 获取一个可编历对象,使用它可以逐个获取匹配的文件路径名。与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而glob.iglob一次只获取一个匹配路径。

3.eg:

import glob 
 
print glob.glob(r'E:\*\*.doc') 
print glob.glob(r'.\*.py') 
 
f = glob.iglob(r'.\*.py') 
 
for py in f: 
  print py 

运行结果:

['E:\\test_file\\adplus.doc'] 
['.\\perfrom_test.py', '.\\pyTest.py', '.\\simulation_login.py', '.\\widget.py', '.\\__init__.py'] 
.\perfrom_test.py 
.\pyTest.py 
.\simulation_login.py 
.\widget.py 
.\__init__.py 

下面我们分知识点详细来讲:


通配符
星号匹配一个文件名段中的0个或多个字符。

import glob
for name in glob.glob('tmp/*'):
  print name

这个模式会匹配所有的路径名,但是不会递归搜索到子目录。

>>> ================================ RESTART ================================
>>> 
tmp\checklog_status.sh
tmp\check_Adwords_v1.2.sh
tmp\check_traffic.sh
tmp\cut_nginxlog_V1.2.sh
tmp\ip_conn.sh
tmp\ip_keepalive.sh
tmp\nagios使用手册.doc
tmp\nmap_ping
tmp\nrpe_install-1.3.sh
tmp\one
tmp\syn.sh
tmp\zabbix_agentd_2.0.10_win_V1.2.bat
tmp\zabbix_agentd_2.0.8_V1.3.sh
tmp\工作内容.doc

要列出子目录中的文件,必须把子目录包含在模式中。

import glob
print 'Name explicitly:'
for name in glob.glob('tmp/one/*'):
  print '\t', name
print 'Name with wildcard:'
for name in glob.glob('tmp/*/*'):
  print '\t', name 

第一种情况显示列出子目录名,第二种情况则依赖一个通配符查找目录。

>>> ================================ RESTART ================================
>>> 
Name explicitly:
  tmp/one\another.txt
  tmp/one\file.txt
Name with wildcard:
  tmp\one\another.txt
  tmp\one\file.txt


单字节通配符
问号会匹配文件名中该位置的单个字符。

import glob
for name in glob.glob('tmp/chec?_traffic.sh'):
  print name
>>> ================================ RESTART ================================
>>> 
tmp\check_traffic.sh

   

字符区间
使用字符区间([a-z]),可以匹配多个字符中的一个字符。

import glob
for name in glob.glob('tmp/one/[a-z]*'):
  print name

区间可以匹配所有小写字母。   

>>> ================================ RESTART ================================
>>> 
tmp/one\another.txt
tmp/one\file.txt

相关文章

  • Python+Selenium+phantomjs实现网页模拟登录和截图功能(windows环境)

    Python+Selenium+phantomjs实现网页模拟登录和截图功能(windows环境)

    Python是一种跨平台的计算机程序设计语言,它可以运行在Windows、Mac和各种Linux/Unix系统上。这篇文章主要介绍了Python+Selenium+phantomjs实现网页模拟登录和截图功能,需要的朋友可以参考下
    2019-12-12
  • 在python中写个自定义数据包协议的打包和解包测试

    在python中写个自定义数据包协议的打包和解包测试

    这篇文章主要介绍了在python中写个自定义数据包协议的打包和解包测试,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • 分析总结Python数据化运营KMeans聚类

    分析总结Python数据化运营KMeans聚类

    本文主要以 Python 使用 Keans 进行聚类分析的简单举例应用介绍聚类分析,它是探索性数据挖掘的主要任务,也是统计数据分析的常用技术,用于许多领域
    2021-08-08
  • Python中的zip函数使用示例

    Python中的zip函数使用示例

    这篇文章主要介绍了Python中的zip函数使用示例,Python中的zip函数不是用来压缩文件的,而是用来传入参数返回一个tuple列表的,需要的朋友可以参考下
    2015-01-01
  • 详解Django中 render() 函数的使用方法

    详解Django中 render() 函数的使用方法

    这篇文章主要介绍了Django中 render() 函数的使用方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04
  • Python进程崩溃AttributeError异常问题解决

    Python进程崩溃AttributeError异常问题解决

    这篇文章主要介绍了Python进程崩溃(AttributeError异常)问题解决,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下方法
    2023-06-06
  • 使用python绘制温度变化雷达图

    使用python绘制温度变化雷达图

    这篇文章主要为大家介绍了使用python绘制温度变化雷达图,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • Python+matplotlib绘制不同大小和颜色散点图实例

    Python+matplotlib绘制不同大小和颜色散点图实例

    这篇文章主要介绍了Python+matplotlib绘制不同大小和颜色散点图实例,matplotlib的用法是比较多种多样的,下面一起看看其中的一个实例吧
    2018-01-01
  • python3读取excel文件只提取某些行某些列的值方法

    python3读取excel文件只提取某些行某些列的值方法

    今天小编就为大家分享一篇python3读取excel文件只提取某些行某些列的值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • python 字典的概念叙述和使用方法

    python 字典的概念叙述和使用方法

    Python中还有一个很重要的数据类型就是字典,其实集合的底层使用的也是字典,这篇文章主要介绍了python 字典的概念叙述和使用方法,需要的朋友可以参考下
    2023-02-02

最新评论