Python实现清理重复文件功能的示例代码

 更新时间:2022年07月26日 16:05:07   作者:锋小刀  
在电脑上或多或少的存在一些重复文件,体积小的倒没什么,如果体积大的就很占内存了。本文用python制作了一个删除重复文件的小工具,核心代码很简单,希望对你有所帮助

在电脑上或多或少的存在一些重复文件,体积小的倒没什么,如果体积大的就很占内存了,而如果自己一个一个查看文件是否重复,然后再删除,还是很要命的。

为此,我用python制作了一个删除重复文件的小工具,核心代码很简单,就十行代码,不管什么类型的文件都可以一键删除!

前置

PySimpleGUI库用来创建可视化界面,os操作文件,只需要这两个库:

import os
import PySimpleGUI as sg

os为内置库,PySimpleGUI使用pip命令安装即可:

pip install 库名

查找、删除重复文件

查找重复文件分为两步:

第一步是获得需要查找的文件路径;

第二步是各个文件进行对比出重复文件。

这里用os.walk()遍历文件夹下的所有文件,该函数可以得到一个三元元组(root,dirs,files),参数含义如下:

  • root:所指的是当前正在遍历的这个文件夹的本身的地址;
  • dirs:是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录);
  • files:同样是 list , 内容是该文件夹中所有的文件(不包括子目录)。

file_path即walk()函数中的参数top,是你所要遍历的目录的路径,C、D盘或者指定文件夹均可:

 for root, dirs, files in os.walk(file_path):
     for file in files:
      # 组合得到文件夹所有文件的路径
         path = os.path.join(root, file)

得到所有的文件路径后,对其进行读取,不同的文件格式读取出来的内容都是不同的,然后通过字典映射的方式存储读取的内容和路径,接着只需要进行判断是否有重复的内容,有的话根据路径用os.remove()进行删除:

dict = {}
f = open(path, 'rb').read()
if f in dict:
     # 删除
     os.remove(path)
     print('删除重复文件:', path)
 else:
     dict[f] = path

以上就是核心代码,一共十行。

GUI制作

为了以后方便使用,不用一次次跑程序,而在原有的程序基础上进行GUI制作,最后打包成.exe可执行文件。

GUI界面设计

界面我只做了个简单的基础版本,相关内容可以看千图成像,有兴趣的还可以加入“选择需要删除文件格式”的选项,进行选择性删除。

# 主题设置
sg.theme('LightBrown3')  

# 布局设置
layout = [
    [sg.Frame(layout=[
        [sg.InputText(key='file_path', size=(41, 1), font=("微软雅黑", 10), enable_events=True),
         sg.FolderBrowse('选择文件夹',
                       font=("微软雅黑", 12)),
         ],
    ],
        title='文件夹选择', title_color='blue', font=("微软雅黑", 10), relief=sg.RELIEF_SUNKEN, )],
    [sg.Frame(layout=[
        [sg.Output(size=(51, 10), font=("微软雅黑", 10))],
    ],
        title='信息展示', title_color='blue', font=("微软雅黑", 10), relief=sg.RELIEF_SUNKEN, )],

    [sg.Button('开始删除', font=("微软雅黑", 12)),
     sg.Text('', font=("微软雅黑", 12), size=(27, 0)), sg.Button('退出程序', font=("微软雅黑", 12), button_color='red')]
]

# 创建窗口
window = sg.Window('删除重复文件', layout, font=("微软雅黑", 12), default_element_size=(80, 1))

filepath = []

# 事件循环
while True:
    # 退出按钮
    event, values = window.read()
    if event in (None, '退出程序'):
        break
window.close()

界面效果如下:

GUI界面效果

逻辑设计

获取文件夹路径,把得到的路径存入列表中:

 if event == 'file_path':
    files = values['file_path']
    if os.path.exists(files):
        filepath.append(files)
    else:
        print('文件夹不存在,请重新选择!')
        sg.popup('文件夹不存在,请重新选择!')

启动按钮,点击时把路径列表传入main函数中:

if event == '开始删除':
    if len(filepath) != 0:
        main(filepath)
    else:
        sg.popup('文件夹未选择!')

GUI打包

打包可以直接使用pyinstaller进行安装;如果你不知道怎么打包,或者不熟悉命令行操作,可以使用前面文章:打包工具,这款打包工具可以简单的满足打包需求。

使用pyinstaller库打包,启动命令行窗口,在命令行窗口cd到文件所在的文件目录中,最后用下面命令进行打包:

pyinstaller -F -w 名称.py

打包过程没出现什么状况,会得到几个文件,进入dist文件夹,就可以看见.exe文件了。

效果展示

示例结果

至此,我们就成功利用Python实现了清理重复文件工具。

到此这篇关于Python实现清理重复文件功能的示例代码的文章就介绍到这了,更多相关Python清理重复文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解Python如何批量检查图像是否可用

    详解Python如何批量检查图像是否可用

    数据集中的图像,一般不可用在以下3个方面:图像过小、无法打开和“Premature end of JPEG file”。本文将为大家介绍Python如何批量检查图像是否可用,感兴趣的可以了解一下
    2022-06-06
  • Python 中 Selenium 的 send_keys() 函数用法小结

    Python 中 Selenium 的 send_keys() 函数用法小结

    send_keys() 是将数字、文本和符号等键盘输入发送到应用程序的文本框的过程, send_keys() 是 WebDriver 的一部分,每个键盘输入都会发送到此元素,这篇文章主要介绍了Python 中 Selenium 的 send_keys() 函数,需要的朋友可以参考下
    2023-11-11
  • 详解numpy.ndarray.reshape()函数的参数问题

    详解numpy.ndarray.reshape()函数的参数问题

    这篇文章主要介绍了详解numpy.ndarray.reshape()函数的参数问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • Atom的python插件和常用插件说明

    Atom的python插件和常用插件说明

    这篇文章给大家分享了Atom的python插件和常用插件,有需要的朋友们可以学习参考下。
    2018-07-07
  • python实现钉钉机器人自动打卡天天早下班

    python实现钉钉机器人自动打卡天天早下班

    这篇文章主要为大家介绍了python实现钉钉机器人自动打卡天天下早班实例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • 在Python的web框架中中编写日志列表的教程

    在Python的web框架中中编写日志列表的教程

    这篇文章主要介绍了在Python中编写日志列表的教程,示例代码基于Python2.x版本,需要的朋友可以参考下
    2015-04-04
  • Python实现病毒仿真器的方法示例(附demo)

    Python实现病毒仿真器的方法示例(附demo)

    这篇文章主要介绍了Python实现病毒仿真器的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • Python 页面解析Beautiful Soup库的使用方法

    Python 页面解析Beautiful Soup库的使用方法

    Beautiful Soup 简称 BS4(其中 4 表示版本号)是一个 Python 中常用的页面解析库,它可以从 HTML 或 XML 文档中快速地提取指定的数据,这篇文章主要介绍了springboot 集成 docsify 实现随身文档 ,需要的朋友可以参考下
    2022-09-09
  • python中return如何写

    python中return如何写

    在本篇文章里小编给大家分享的是一篇关于python中return如何写的知识点总结,需要的朋友们参考学习下。
    2020-06-06
  • Python3实现带附件的定时发送邮件功能

    Python3实现带附件的定时发送邮件功能

    这篇文章主要为大家详细介绍了Python3实现带附件的定时发送邮件功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02

最新评论