Python读写压缩文件的方法

 更新时间:2020年07月30日 15:25:17   作者:David Beazley  
这篇文章主要介绍了Python读写压缩文件的方法,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下

问题

你想读写一个gzip或bz2格式的压缩文件。

解决方案

gzip bz2 模块可以很容易的处理这些文件。 两个模块都为 open() 函数提供了另外的实现来解决这个问题。 比如,为了以文本形式读取压缩文件,可以这样做:

# gzip compression
import gzip
with gzip.open('somefile.gz', 'rt') as f:
  text = f.read()

# bz2 compression
import bz2
with bz2.open('somefile.bz2', 'rt') as f:
  text = f.read()

类似的,为了写入压缩数据,可以这样做:

# gzip compression
import gzip
with gzip.open('somefile.gz', 'wt') as f:
  f.write(text)

# bz2 compression
import bz2
with bz2.open('somefile.bz2', 'wt') as f:
  f.write(text)

如上,所有的I/O操作都使用文本模式并执行Unicode的编码/解码。 类似的,如果你想操作二进制数据,使用 rb 或者 wb 文件模式即可。

讨论

大部分情况下读写压缩数据都是很简单的。但是要注意的是选择一个正确的文件模式是非常重要的。 如果你不指定模式,那么默认的就是二进制模式,如果这时候程序想要接受的是文本数据,那么就会出错。 gzip.open()bz2.open() 接受跟内置的 open() 函数一样的参数, 包括 encodingerrorsnewline 等等。

当写入压缩数据时,可以使用 compresslevel 这个可选的关键字参数来指定一个压缩级别。比如:

with gzip.open('somefile.gz', 'wt', compresslevel=5) as f:
  f.write(text)

默认的等级是9,也是最高的压缩等级。等级越低性能越好,但是数据压缩程度也越低。

最后一点, gzip.open() bz2.open() 还有一个很少被知道的特性, 它们可以作用在一个已存在并以二进制模式打开的文件上。比如,下面代码是可行的:

import gzip
f = open('somefile.gz', 'rb')
with gzip.open(f, 'rt') as g:
  text = g.read()

这样就允许 gzip bz2 模块可以工作在许多类文件对象上,比如套接字,管道和内存中文件等。

以上就是Python读写压缩文件的方法的详细内容,更多关于Python 读写压缩文件的资料请关注脚本之家其它相关文章!

相关文章

  • python生成圆形图片的方法

    python生成圆形图片的方法

    这篇文章主要为大家详细介绍了python生成圆形图片的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • Python3爬楼梯算法示例

    Python3爬楼梯算法示例

    这篇文章主要介绍了Python3爬楼梯算法,涉及Python基于面向对象的字符串遍历、切片、运算等相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • 解决pytorch报错:AssertionError: Invalid device id的问题

    解决pytorch报错:AssertionError: Invalid device id的问题

    今天小编就为大家分享一篇解决pytorch报错:AssertionError: Invalid device id的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • 介绍Python的Urllib库的一些高级用法

    介绍Python的Urllib库的一些高级用法

    这篇文章主要介绍了Python的Urllib库的一些高级用法,是用Python编写爬虫的一些基础知识,需要的朋友可以参考下
    2015-04-04
  • Python数学形态学实例分析

    Python数学形态学实例分析

    这篇文章主要介绍了Python数学形态学,结合实例形式分析了Python数学运算与图形绘制相关操作技巧,需要的朋友可以参考下
    2019-09-09
  • 解决启动django,浏览器显示“服务器拒绝访问”的问题

    解决启动django,浏览器显示“服务器拒绝访问”的问题

    这篇文章主要介绍了解决启动django,浏览器显示“服务器拒绝访问”的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • 使用Python将word中的图片进行导出功能

    使用Python将word中的图片进行导出功能

    这篇文章主要为大家详细介绍了如何使用Python将word中的图片进行导出功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-01-01
  • 用Python3通过PyCharm上传代码到Git服务器的详细过程

    用Python3通过PyCharm上传代码到Git服务器的详细过程

    上传代码到服务器,如果不知道的情况下还用传统的方式上传很麻烦,现在很多IDE都提供上传代码的功能,例如:VSCode,PyCharm等等,本文讲解的是PyCharm,需要的朋友可以参考下
    2024-03-03
  • Python中numpy数组的维度增减方法详解

    Python中numpy数组的维度增减方法详解

    这篇文章主要介绍了Python中numpy数组的维度增减方法详解,在操作数组情况下,需要按照某个轴将不同数组的维度对齐,这时候需要为数组添加维度(特别是将二维数组变成高维张量的情况下),numpy提供了expand_dims()函数来为数组增加维度,需要的朋友可以参考下
    2023-09-09
  • SciPy中两个模块:io 和misc的使用

    SciPy中两个模块:io 和misc的使用

    这篇文章主要介绍了SciPy中两个模块:io 和misc的使用,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05

最新评论