Python实现文件/文件夹复制功能

 更新时间:2025年04月01日 08:59:35   作者:ak啊  
在数据处理和文件管理的日常工作中,我们经常需要复制文件夹及其子文件夹下的特定文件,手动操作不仅效率低下,而且容易出错,因此,使用编程语言自动化这一任务显得尤为重要,所以本文给大家介绍了使用Python实现文件/文件夹复制功能,需要的朋友可以参考下

一、基础工具库介绍

Python标准库中的shutil模块是主要工具:

import shutil
import os

二、文件复制基础

1. 复制单个文件

# 保留元数据(修改时间等)
shutil.copy2('source.txt', 'destination.txt')

# 仅复制内容
shutil.copy('source.txt', 'backup/')  # 自动保留文件名

# 文件流方式(适合大文件)
with open('source.txt', 'rb') as src, open('dest.txt', 'wb') as dst:
    shutil.copyfileobj(src, dst, length=16*1024)  # 16KB缓冲区

三、目录复制进阶

1. 简单目录复制

# 复制整个目录(目标目录必须不存在)
shutil.copytree('src_dir', 'dst_dir')

# 允许覆盖已存在目录(Python 3.8+)
shutil.copytree('src', 'existing_dir', dirs_exist_ok=True)

2. 自定义复制过程

def ignore_patterns(*patterns):
    def _ignore(path, names):
        ignored = []
        for pattern in patterns:
            ignored.extend(fnmatch.filter(names, pattern))
        return set(ignored)
    return _ignore

# 排除.pyc文件和临时文件
shutil.copytree('src', 'dst', ignore=ignore_patterns('*.pyc', '*.tmp'))

# 带进度回调的复制
def copy_progress(src, dst, *, follow_symlinks=True):
    print(f"Copying {src} => {dst}")

shutil.copytree('src', 'dst', copy_function=copy_progress)

四、高级自定义实现

当需要完全控制复制流程时,可以手动实现:

def deep_copy(src, dst, symlinks=False):
    if not os.path.exists(dst):
        os.makedirs(dst)
        shutil.copystat(src, dst)
    
    for item in os.listdir(src):
        src_path = os.path.join(src, item)
        dst_path = os.path.join(dst, item)
        
        if os.path.isdir(src_path):
            deep_copy(src_path, dst_path, symlinks)
        else:
            if os.path.exists(dst_path):
                if os.path.samefile(src_path, dst_path):
                    continue
                os.remove(dst_path)
            if symlinks and os.path.islink(src_path):
                linkto = os.readlink(src_path)
                os.symlink(linkto, dst_path)
            else:
                shutil.copy2(src_path, dst_path)

五、异常处理要点

try:
    shutil.copytree('src', 'dst')
except shutil.Error as e:
    print(f'Directory not copied. Error: {e}')
except OSError as e:
    print(f'OSError: {e.strerror}')

六、性能优化建议

  • 批量小文件:使用shutil.copytree的默认实现
  • 超大文件:使用copyfileobj分块复制
  • 网络存储:增加缓冲区大小(例如16*1024*1024即16MB)
  • 并行处理:对独立子目录使用多线程/多进程

七、完整示例代码

import shutil
import os
from pathlib import Path

def smart_copy(src, dst, overwrite=False, ignore=None):
    """智能复制器"""
    src = Path(src)
    dst = Path(dst)

    if src.is_file():
        if dst.is_dir():
            dst = dst / src.name
        if dst.exists():
            if overwrite:
                dst.unlink()
            else:
                raise FileExistsError(f"{dst} already exists")
        shutil.copy2(str(src), str(dst))
        return

    if not src.is_dir():
        raise ValueError("Source path invalid")

    if dst.exists():
        if overwrite:
            if dst.is_dir():
                shutil.rmtree(dst)
            else:
                dst.unlink()
        else:
            raise FileExistsError(f"{dst} already exists")

    shutil.copytree(
        str(src),
        str(dst),
        symlinks=True,
        ignore=ignore,
        copy_function=shutil.copy2,
        dirs_exist_ok=overwrite
    )

# 使用示例
smart_copy(
    '/data/project',
    '/backup/project_2024',
    overwrite=True,
    ignore=shutil.ignore_patterns('*.log', 'temp')
)

关键点说明:

  • 使用copy2而不是copy可以保留文件元数据
  • Path对象比字符串路径更安全易用
  • dirs_exist_ok参数需要Python 3.8+
  • 自定义ignore模式支持复杂过滤逻辑
  • 完善的异常处理保证操作可靠性

这种方法可以处理以下复杂场景:

  • 混合文件类型(普通文件/符号链接/特殊文件)
  • 保留所有文件属性
  • 覆盖已有内容的安全处理
  • 灵活的过滤机制
  • 跨平台兼容性(Windows/Unix)

以上就是Python实现文件/文件夹复制功能的详细内容,更多关于Python文件/文件夹复制的资料请关注脚本之家其它相关文章!

相关文章

  • Python Faker库基本用法详解

    Python Faker库基本用法详解

    Faker 是一个非常强大的库,适用于生成各种类型的伪随机数据,可以帮助开发者在测试、数据生成、或其他需要随机数据的场景中提高效率,本文给大家介绍Python Faker库基本用法详解,感兴趣的朋友一起看看吧
    2025-04-04
  • Python Django2.0集成Celery4.1教程

    Python Django2.0集成Celery4.1教程

    今天小编就为大家分享一篇Python Django2.0集成Celery4.1教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • python系统指定文件的查找只输出目录下所有文件及文件夹

    python系统指定文件的查找只输出目录下所有文件及文件夹

    这篇文章主要介绍了python系统指定文件的查找只输出目录下所有文件及文件夹,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-01-01
  • Python异常处理机制结构实例解析

    Python异常处理机制结构实例解析

    这篇文章主要介绍了Python异常处理机制结构实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 通过python 执行 nohup 不生效的解决

    通过python 执行 nohup 不生效的解决

    这篇文章主要介绍了通过python 执行 nohup 不生效的解决,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python sys模块sys.path使用方法示例

    python sys模块sys.path使用方法示例

    这篇文章主要介绍了python sys模块sys.path使用方法,大家参考使用
    2013-12-12
  • python语言使用技巧分享

    python语言使用技巧分享

    下面小编就为大家带来一篇python语言使用技巧分享。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-05-05
  • Python中pytest的参数化实例解析

    Python中pytest的参数化实例解析

    这篇文章主要介绍了Python中pytest的参数化实例解析,pytest是一个非常成熟的全功能的Python测试框架,主要有简单灵活,容易上手,支持参数化等特点,需要的朋友可以参考下
    2023-07-07
  • Python图像处理之图像的灰度线性变换

    Python图像处理之图像的灰度线性变换

    这篇文章主要介绍了Python图像处理之图像的灰度线性变换,文章围绕主题展开详细的内容戒杀,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-09-09
  • Pandas中运行速度优化的常用方法介绍

    Pandas中运行速度优化的常用方法介绍

    这篇文章主要为大家详细介绍了几种pandas中常用到的方法,对于这些方法使用存在哪些需要注意的问题,以及如何对它们进行速度提升,需要的小伙伴可以参考下
    2025-03-03

最新评论