Python判断两个文件是否相同与两个文本进行相同项筛选的方法

 更新时间:2019年03月01日 09:37:38   作者:qq_36155051  
今天小编就为大家分享一篇关于Python判断两个文件是否相同与两个文本进行相同项筛选的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

  • python 读写中文json的实例详解

    python 读写中文json的实例详解

    这篇文章主要介绍了 python 读写中文json的实例详解的相关资料,希望通过本文能帮助到大家,让大家掌握这样的内容,需要的朋友可以参考下
    2017-10-10
  • 详解Python语法之模块Module

    详解Python语法之模块Module

    这篇文章主要为大家介绍了Python语法之模块Module,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • Python中的re模块之正则表达式模块常用方法

    Python中的re模块之正则表达式模块常用方法

    re模块是Python中使用正则表达式的最基础的模块,re模块的这些功能覆盖了正则表达式的常见用法,使用re模块可以简化字符串的模式匹配、信息提取、过滤替换、切分等操作,本文给大家介绍正则表达式模块常用方法,感兴趣的朋友跟随小编一起看看吧
    2023-08-08
  • Python中的random()方法的使用介绍

    Python中的random()方法的使用介绍

    这篇文章主要介绍了Python中的random()方法的使用,是Python入门的基础知识,需要的朋友可以参考下
    2015-05-05
  • python实现备份目录的方法

    python实现备份目录的方法

    这篇文章主要介绍了python实现备份目录的方法,实例总结了Python实现备份目录的三种常用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-08-08
  • pytorch 加载(.pth)格式的模型实例

    pytorch 加载(.pth)格式的模型实例

    今天小编就为大家分享一篇pytorch 加载(.pth)格式的模型实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • tensorflow 实现从checkpoint中获取graph信息

    tensorflow 实现从checkpoint中获取graph信息

    今天小编就为大家分享一篇tensorflow 实现从checkpoint中获取graph信息,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • python文件与路径管理方法

    python文件与路径管理方法

    这篇文章主要介绍了python文件与路径管理方法,文章属于python使用技巧的分享,下文围绕文件与路径管理相关内容,需要的小伙伴可以参考一下,希望对你有所帮助
    2022-02-02
  • numpy中nan_to_num的具体使用

    numpy中nan_to_num的具体使用

    在Numpy中NaN值一般出现在数据清洗前,出现这个值说明这个数据是缺失的,本文主要介绍了numpy中nan_to_num的具体使用,感兴趣的可以了解一下
    2022-08-08
  • Python使用PymuPDF处理PDF文件的操作详解

    Python使用PymuPDF处理PDF文件的操作详解

    Python 中的 PymuPDF 是一个强大的库,可以让你轻松地处理 PDF 文件,本文将深入探讨 PymuPDF 的用法,包括打开、读取、修改和创建 PDF 文件,以及文本提取和页面操作,感兴趣的朋友可以参考下
    2023-12-12

最新评论