python中h5py开源库的使用样例详解

更新时间：2022年05月18日 16:38:52 作者：燕阳天

这篇文章主要介绍了python中的h5py开源库的使用,本文只是简单的对h5py库的基本创建文件，数据集和读取数据的方式进行介绍,需要的朋友可以参考下

一、h5py模块介绍

本文只是简单的对h5py库的基本创建文件，数据集和读取数据的方式进行介绍！如果读者需要进一步详细的学习h5py的更多知识，请参考h5py的官方文档。

h5py简单介绍

一个HDF5文件是一种存放两类对象的容器：dataset和group. Dataset是类似于数组的数据集，而group是类似文件夹一样的容器，它好比python中的字典，有键(key)和值(value)，存放dataset和其他group。在使用h5py的时候需要牢记一句话：groups类比字典，dataset类比Numpy中的数组。

HDF5的dataset虽然与Numpy的数组在接口上很相近，但是支持更多对外透明的存储特征，如：数据压缩，误差检测，分块传输。

二、h5py模块使用

h5py创建的文件后缀名为：.hdf5

1、h5py接口简单介绍

h5py模块的使用主要分成两步走：

1）创建.hdf5类型文件句柄（创建一个对象） # 读取文件把“w”改成“r”

f=h5py.File("myh5py.hdf5","w")

2）创建数据（dataset）或组（group）

创建数据（dataset）:

f.create_dataset(self, name, shape=None, dtype=None, data=None, **kwds)

创建组（group）：

create_group(self, name, track_order=False)

2、h5py的使用样例

创建一个h5py文件

import h5py
#要是读取文件的话，就把w换成r
f=h5py.File("myh5py.hdf5","w")

在当前目录下会生成一个myh5py.hdf5文件

创建dataset数据集

import h5py
f=h5py.File("myh5py.hdf5","w")
#deset1是数据集的name，（20,）代表数据集的shape，i代表的是数据集的元素类型
d1=f.create_dataset("dset1", (20,), 'i')
for key in f.keys():
    print(key)
    print(f[key].name)
    print(f[key].shape)
    print(f[key].value)
输出：
dset1
/dset1
(20,)
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

这里我们仅仅创建了一个存放20个整型元素的数据集，并没有赋值，默认全是0，如何赋值呢，看下面的代码。

import h5py
import numpy as np
f=h5py.File("myh5py.hdf5","w")
d1=f.create_dataset("dset1",(20,),'i')
#赋值
d1[...]=np.arange(20)
#或者我们可以直接按照下面的方式创建数据集并赋值
f["dset2"]=np.arange(15)

for key in f.keys():
    print(f[key].name)
    print(f[key].value)

输出：
/dset1
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]
/dset2
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]

如果我们有现成的numpy数组，那么可以在创建数据集的时候就赋值，这个时候就不必指定数据的类型和形状了，只需要把数组名传给参数data。

import h5py
import numpy as np
f=h5py.File("myh5py.hdf5","w")
a=np.arange(20)
d1=f.create_dataset("dset1",data=a)
for key in f.keys():
    print(f[key].name)
    print(f[key].value)

输出：
/dset1
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]

现在把这几种创建的方式混合写下。看下面的代码

import h5py
import numpy as np
f=h5py.File("myh5py.hdf5","w")
#分别创建dset1,dset2,dset3这三个数据集
a=np.arange(20)
d1=f.create_dataset("dset1",data=a)
d2=f.create_dataset("dset2",(3,4),'i')
d2[...]=np.arange(12).reshape((3,4))
f["dset3"]=np.arange(15)
for key in f.keys():
    print(f[key].name)
    print(f[key].value)
输出：
/dset1
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]
/dset2
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
/dset3
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]
3. 创建group组
import h5py
import numpy as np
f=h5py.File("myh5py.hdf5","w")
#创建一个名字为bar的组
g1=f.create_group("bar")
#在bar这个组里面分别创建name为dset1,dset2的数据集并赋值。
g1["dset1"]=np.arange(10)
g1["dset2"]=np.arange(12).reshape((3,4))
for key in g1.keys():
    print(g1[key].name)
    print(g1[key].value)
输出：
/bar/dset1
[0 1 2 3 4 5 6 7 8 9]
/bar/dset2
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

注意观察数据集dset1和dset2的名字是不是有点和前面的不一样，如果是直接创建的数据集，不在任何组里面，那么它的名字就是/+名字，现在这两个数据集都在bar这个group(组)里面，名字就变成了/bar+/名字，是不是有点文件夹的感觉！继续看下面的代码，你会对group和dataset的关系进一步了解。

import h5py
import numpy as np
f=h5py.File("myh5py.hdf5","w")
#创建组bar1,组bar2，数据集dset
g1=f.create_group("bar1")
g2=f.create_group("bar2")
d=f.create_dataset("dset",data=np.arange(10))
#在bar1组里面创建一个组car1和一个数据集dset1。
c1=g1.create_group("car1")
d1=g1.create_dataset("dset1",data=np.arange(10))
#在bar2组里面创建一个组car2和一个数据集dset2
c2=g2.create_group("car2")
d2=g2.create_dataset("dset2",data=np.arange(10))
#根目录下的组和数据集
print(".............")
for key in f.keys():
    print(f[key].name)
#bar1这个组下面的组和数据集
print(".............")
for key in g1.keys():
    print(g1[key].name)

#bar2这个组下面的组和数据集
print(".............")
for key in g2.keys():
    print(g2[key].name)
#顺便看下car1组和car2组下面都有什么，估计你都猜到了为空。
print(".............")
print(c1.keys())
print(c2.keys())
输出：
.............
/bar1
/bar2
/dset
.............
/bar1/car1
/bar1/dset1
.............
/bar2/car2
/bar2/dset2
.............
[]
[]

Reference：

1、blog.csdn.net/csdn1569884…

2、blog.csdn.net/yudf2010/ar…

到此这篇关于python中h5py开源库的使用的文章就介绍到这了,更多相关python h5py开源库内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

PyQt5如何将.ui文件转换为.py文件的实例代码
这篇文章主要介绍了PyQt5之如何将.ui文件转换为.py文件,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-05-05
python 提取tuple类型值中json格式的key值方法
今天小编就为大家分享一篇python 提取tuple类型值中json格式的key值方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-12-12
Python采集电影评论实战示例
这篇文章主要为大家介绍了Python采集电影评论实现示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-04-04
python 执行函数的九种方法
这篇文章主要介绍了python 执行函数的九种方法，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下
2021-03-03
python实现列表的排序方法分享
在本篇文章里小编给大家分享了关于python实现列表的排序方法以及相关知识点，有兴趣的朋友们可以学习下。
2019-07-07
Python getsizeof()和getsize()区分详解
这篇文章主要介绍了Python getsizeof()和getsize()区分详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-11-11
pytorch 如何把图像数据集进行划分成train,test和val
这篇文章主要介绍了pytorch 把图像数据集进行划分成train,test和val的操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-05-05
Python利用tkinter实现一个简易番茄钟的示例代码
番茄钟是番茄工作法使用的一个时间表，即选择一个待完成的任务，将番茄时间设为25分钟，专注工作，中途不允许做任何与该任务无关的事，直到番茄时钟响起，然后在纸上画一个X短暂休息一下。本文用tkinter实现一个简易番茄钟，需要的可以参考一下
2022-12-12
利用Python实现生成颜色表(color chart)
在做色彩相关的算法分析时候，经常需要使用规则的颜色表来进行辅助，本文就来利用numpy和opencv生成颜色表并保存为图片，需要的可以参考一下
2023-05-05
Django利用Cookie实现反爬虫的例子
这篇文章主要介绍了Django利用Cookie实现反爬虫，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-04-04