Python基于正则表达式实现检查文件内容的方法【文件检索】

 更新时间:2017年08月30日 09:31:00   作者:ykdsg   我要评论

这篇文章主要介绍了Python基于正则表达式实现检查文件内容的方法,可实现针对文件中import强制依赖的文件关系检索,涉及Python文件目录的遍历及正则匹配相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python基于正则表达式实现检查文件内容的方法分享给大家供大家参考,具体如下:

这个是之前就在学python,欣赏python的小巧但是功能强大,是连电池都自带的语言。平时工作中用Java ,觉得python在日常生活中比java用处要大,首先语法没那么复杂,特别是io的操作,java里要写一大坨没关的代码。还有就是不用编译,而且linux系统默认都会自带。

这次遇到的问题是工作当中想要迁移一个系统中的一个模块,这个时候需要评估模块里的代码有没有对其他代码强依赖,就是有没有import 其他模块的代码。如果通过人肉来坐,少量的文件还好,如果有大量的文件实在是很悲剧。这个时候就想起可以用pytho来检索文件,通过正则表达式分析文件内容,把有问题的文件名打印出来就可以了。

import os
import os.path
import re
packDir='/**/src/main/java/com/hz/yk/auction'
p1=re.compile(r"yk\.((?!auction)\w)+\b")
p2=re.compile(r"yk\.((?!domain)\w)+\b")
p3=re.compile(r"yk\.((?!utils)\w)+\b")
def processDirectory(args,dirname,filenames):
  # print 'Directory',dirname
  for filename in filenames:
    if os.path.splitext(filename)[1]=='.java':
      # print 'file',filename
      fileObj=open(dirname+ "/"+filename)
      hasOther=False
      for line in fileObj:
        if p1.search(line) and p2.search(line) and p3.search(line):
          hasOther=True
          print line
      if hasOther:
        print 'file:',filename
def search():
  os.path.walk(packDir,processDirectory,None)
if __name__ == '__main__':
  search()

因为希望看到应用其他模块的代码,所以排除掉自己的模块名auction和公共的应用domain,utils 。对剩下的符合条件的打印出import这句和文件名sikuli

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于Python相关内容可查看本站专题:《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • python+pyqt5实现24点小游戏

    python+pyqt5实现24点小游戏

    这篇文章主要为大家详细介绍了python+pyqt5实现24点小游戏,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Python使用cx_Oracle模块操作Oracle数据库详解

    Python使用cx_Oracle模块操作Oracle数据库详解

    这篇文章主要介绍了Python使用cx_Oracle模块操作Oracle数据库,结合实例形式较为详细的分析了cx_Oracle模块的下载、安装及针对Oracle数据库的连接、执行SQL语句、存储过程等相关操作技巧,需要的朋友可以参考下
    2018-05-05
  • 用tensorflow构建线性回归模型的示例代码

    用tensorflow构建线性回归模型的示例代码

    本篇文章主要介绍了用tensorflow构建线性回归模型的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-03-03
  • Python3 Post登录并且保存cookie登录其他页面的方法

    Python3 Post登录并且保存cookie登录其他页面的方法

    今天小编就为大家分享一篇Python3 Post登录并且保存cookie登录其他页面的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python中常见的异常总结

    Python中常见的异常总结

    当 Python 检测到一个错误时,解释器就会指出当前流已经无法继续执行下去,这时候就出现了异常。
    2018-02-02
  • Python判断文本中消息重复次数的方法

    Python判断文本中消息重复次数的方法

    这篇文章主要介绍了Python判断文本中消息重复次数的方法,涉及Python针对文本文件的读取与字符串操作的相关技巧,需要的朋友可以参考下
    2016-04-04
  • 跟老齐学Python之for循环语句

    跟老齐学Python之for循环语句

    看这个标题,有点匪夷所思吗?为什么for是难以想象的呢?因为在python中,它的确是很常用而且很强悍,强悍到以至于另外一个被称之为迭代的东西,在python中就有点相形见绌了。在别的语言中,for的地位从来没有如同python中这么高的。
    2014-10-10
  • Python算法之图的遍历

    Python算法之图的遍历

    这篇文章主要介绍了Python算法之图的遍历,涉及遍历算法BFS和DFS,以及寻找图的(强)连通分量的算法等相关内容,具有一定参考价值,需要的朋友可以了解下。
    2017-11-11
  • python 与GO中操作slice,list的方式实例代码

    python 与GO中操作slice,list的方式实例代码

    这篇文章主要介绍了python 与GO中操作slice,list的方式实例代码的相关资料,需要的朋友可以参考下
    2017-03-03
  • Python中获取对象信息的方法

    Python中获取对象信息的方法

    这篇文章主要介绍了Python中获取对象信息的方法,是Python学习当中的基础知识,需要的朋友可以参考下
    2015-04-04

最新评论