Python解析压缩包内部文件的后缀名并分类存放

 更新时间:2024年12月24日 08:48:33   作者:一晌小贪欢  
这篇文章主要为大家详细介绍了如何使用Python解析压缩包内部文件的后缀名并分类存放,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下

1、背景

我们有很多压缩包文件,假设压缩包的种类只有【.7z】,【.rar】,【.zip】,压缩包里面有一个文件,文件可以是不同的格式(后缀),我们希望通过压缩包内的文件后缀,自动创建文件夹,让后将压缩包进行批量移动

如下图:每一个压缩包内都有一个文件(不同类型\也可以相同类型)

预期结果,如下图

2、库的安装

用途安装
py7zr压缩包.7z操作pip install py7zr -i https://pypi.tuna.tsinghua.edu.cn/simple/
rarfile压缩包.rar操作pip install rarfile -i https://pypi.tuna.tsinghua.edu.cn/simple/
zipfile压缩包.rar操作内置库无需安装
os获取绝对路径内置库无需安装

3、核心代码

if zipfile.is_zipfile(archive_path):
    with zipfile.ZipFile(archive_path, 'r') as zip_ref:
        for file_info in zip_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])  # 去掉点号

elif rarfile.is_rarfile(archive_path):
    with rarfile.RarFile(archive_path) as rar_ref:
        for file_info in rar_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

elif py7zr.is_7zfile(archive_path):
    with py7zr.SevenZipFile(archive_path, mode='r') as z7_ref:
        for filename in z7_ref.getnames():
            ext = os.path.splitext(filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

4、完整代码

# -*- coding: UTF-8 -*-
'''
@Project :测试 
@File    :main.py
@IDE     :PyCharm 
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2024/12/23 15:32 
'''


import os
import zipfile
import py7zr
import rarfile
import shutil

# 设置源文件夹和目标文件夹
source_folder = '压缩包数据源'
target_folder = '分类文件夹'

# 检查目标文件夹是否存在,不存在则创建
if not os.path.exists(target_folder):
    os.makedirs(target_folder)


def create_folder(folder_name):
    folder_path = os.path.join(target_folder, folder_name)
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    return folder_path


def get_archive_extensions(archive_path):
    extensions = set()

    try:
        if zipfile.is_zipfile(archive_path):
            with zipfile.ZipFile(archive_path, 'r') as zip_ref:
                for file_info in zip_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])  # 去掉点号

        elif rarfile.is_rarfile(archive_path):
            with rarfile.RarFile(archive_path) as rar_ref:
                for file_info in rar_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])

        elif py7zr.is_7zfile(archive_path):
            with py7zr.SevenZipFile(archive_path, mode='r') as z7_ref:
                for filename in z7_ref.getnames():
                    ext = os.path.splitext(filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])
    except Exception as e:
        print(f"读取文件 {archive_path} 时出错: {str(e)}")
        return set()

    return extensions


# 主程序
for filename in os.listdir(source_folder):
    file_path = os.path.join(source_folder, filename)

    if os.path.isfile(file_path):
        # 获取压缩包内所有文件的扩展名
        extensions = get_archive_extensions(file_path)

        if extensions:
            # 如果只有一种文件类型,移动到对应文件夹
            if len(extensions) == 1:
                ext = extensions.pop()
                dest_folder = create_folder(ext)
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移动 {filename} 到 {ext} 文件夹")
            else:
                # 如果有多种文件类型,移动到 mixed 文件夹
                dest_folder = create_folder('mixed')
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移动 {filename} 到 mixed 文件夹 (包含文件类型: {', '.join(extensions)})")
        else:
            print(f"跳过文件: {filename} (无法读取或没有有效文件)")

到此这篇关于Python解析压缩包内部文件的后缀名并分类存放的文章就介绍到这了,更多相关Python解析文件后缀名内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Java编程迭代地删除文件夹及其下的所有文件实例

    Java编程迭代地删除文件夹及其下的所有文件实例

    这篇文章主要介绍了Java编程迭代地删除文件夹及其下的所有文件实例,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-02-02
  • 如何使用python socket模块实现简单的文件下载

    如何使用python socket模块实现简单的文件下载

    这篇文章主要介绍了如何使用python socket模块实现简单的文件下载,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-09-09
  • Python实现将HTML转成PDF的方法分析

    Python实现将HTML转成PDF的方法分析

    这篇文章主要介绍了Python实现将HTML转成PDF的方法,结合实例形式分析了Python基于pdfkit模块实现HTML转换成PDF文件的相关操作技巧与注意事项,需要的朋友可以参考下
    2019-05-05
  • 利用Python和PyQt5构建一个多功能PDF转换器

    利用Python和PyQt5构建一个多功能PDF转换器

    在日常工作中,处理PDF文件几乎是每个人都不可避免的任务,本文将通过Python和PyQt5搭建一个强大的PDF文件处理平台,希望对大家有所帮助
    2024-12-12
  • Pytorch中index_select() 函数的实现理解

    Pytorch中index_select() 函数的实现理解

    这篇文章主要介绍了Pytorch中index_select() 函数的实现理解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • python requests库的使用

    python requests库的使用

    这篇文章主要介绍了python requests库的使用,帮助大家更好的利用python进行爬虫,感兴趣的朋友可以了解下
    2021-01-01
  • Python中count统计指定字符、元素出现次数的实现

    Python中count统计指定字符、元素出现次数的实现

    本文主要介绍了Python中count统计指定字符、元素出现次数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • 关于pycharm中pip版本10.0无法使用的解决办法

    关于pycharm中pip版本10.0无法使用的解决办法

    近期在利用 pycharm 安装第三方库时会提示 pip 不是最新版本, 因此对 pip 进行更新,但是生成最新版本之后, pip 中由于缺少 main 函数,导致在 pycharm 中无法自动安装第三方库。本文就介绍一下如何解决
    2019-10-10
  • Python 生成多行重复数据的方法实现

    Python 生成多行重复数据的方法实现

    本文主要介绍了Python 生成多行重复数据的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • Python使用自定义装饰器的示例详解

    Python使用自定义装饰器的示例详解

    在Python自动化测试中,可以使用自定义的装饰器来给测试方法传递测试数据。本文将通过简单的示例和大家介绍下具体的使用方法,希望对大家有所帮助
    2022-11-11

最新评论