使用HDFView预览HDF5文件的详细操作
最近在处理一些数据文件时,经常会遇到 .h5、.hdf5 这类后缀的文件。
如果只是想确认文件里有什么数据、有哪些字段、数组维度是多少,直接写代码读当然可以,但有点麻烦。更方便的办法是先用一个可视化工具打开看看。
这里简单介绍一下 HDF5 格式,以及一个常用的 HDF5 查看工具:HDFView。
什么是 HDF5 数据格式?
HDF5,全称是 Hierarchical Data Format version 5 (层次式数据格式第五代),可以理解成一种适合存储复杂科学数据的文件格式。
它和普通的 CSV、Excel 不太一样。
CSV 更像是一张二维表,而 HDF5 更像是一个“小型文件系统”。一个 HDF5 文件里面可以有目录、数据集、属性等结构。
比如一个 .h5 文件内部可能长这样:
/ ├── images │ ├── train │ └── test ├── labels ├── metadata └── config
其中:
✦ Group:类似文件夹,用来组织数据
✦ Dataset:真正存储数据的地方,比如矩阵、数组、图像、时间序列
✦ Attribute:附加信息,比如单位、采样率、实验条件、数据说明
所以 HDF5 很适合用来保存:
✦ 科研实验数据
✦ 大规模矩阵
✦ 图像数据集
✦ 深度学习训练数据
✦ 传感器时间序列
✦ 仿真结果
✦ 生物信息学数据
它的一个优点是可以把很多相关数据放在同一个文件里,而且结构比较清晰。缺点是,如果没有专门工具,直接双击是看不了的。
什么是 HDFView?
虽然我们可以使用 Python 或 MATLAB 代码来查看 HDF5 文件的结构,但是比较麻烦。
HDFView 是 HDF Group 官方推出的一款基于 Java 的跨平台图形化浏览器。
GitHub地址:https://github.com/HDFGroup/hdfview
使用 HDFView,你可以:
✦ 以树状目录结构直观地浏览 HDF5 文件的组、数据集和属性。
✦ 双击数据集直接以表格形式查看具体数值。
HDFView 的安装步骤
HDFView 的官方开源仓库位于:HDFGroup/hdfview。
1. 下载安装包
1. 访问 HDFView 在 GitHub 的发布页面:HDFView Releases。
2. 在最新的 Release 版本(例如 3.4.1 或更高)下,根据你的操作系统下载对应的安装包:
○ Windows:下载 .msi 安装包(例如 HDFView-3.4.1-Windows.msi)。
○ macOS:下载 .dmg 镜像
○ Linux:下载 .tar.gz 压缩包。
2. 安装过程
✦ Windows:双击运行 .msi 引导程序,按照提示一路点击“Next”即可。默认会安装在 C:\Users\<用户名>\AppData\Local\HDFView\。
✦ macOS:双击 .dmg 文件,将 HDFView 图标拖入应用程序(Applications)文件夹。
✦ Linux:解压压缩包,运行解压目录下的启动脚本。
HDFView如何使用
用HDFView打开一个文件后,
左侧是树状视图,可以查看文件夹和数据集层级,右侧是数据的属性信息,主要看维度信息和数据存储格式信息

双击左侧的数据集可以预览数据内容

常见问题
Windows 启动报错 "failed to launch jvm" 怎么办?
这是 Windows 用户在安装后最常遇到的启动错误。
为什么会报错呢?
这是因为 HDFView 运行需要依赖其内置的 Java 虚拟机(JVM)和 HDF5 动态链接库(DLL)。如果你的电脑上安装了 Miniforge/Anaconda (Python 环境) 或 MATLAB 等同样自带 HDF5 库的软件,并且它们在系统环境变量 PATH 中排在前面,Windows 就会错误地去调用这些软件的 DLL,从而导致 JVM 启动失败。
完美的解决办法
1. 打开 PowerShell。
2. 粘贴并运行以下代码(它会自动为 HDFView 注入局部环境变量,解决冲突):
$p = "C:\Users\Achuan-2\AppData\Local\HDFView" # 替换为你的实际安装目录
$exePath = Get-ChildItem -Path $p -Filter "HDFView.exe" -Recurse -ErrorAction SilentlyContinue | Select-Object -First 1
$installDir = $exePath.DirectoryName
$regPath = "HKCU:\Software\Microsoft\Windows\CurrentVersion\App Paths\HDFView.exe"
if (-not (Test-Path $regPath)) { New-Item -Path $regPath -Force | Out-Null }
Set-ItemProperty -Path $regPath -Name "(Default)" -Value $exePath.FullName
Set-ItemProperty -Path $regPath -Name "Path" -Value "$(Join-Path $installDir 'app');$(Join-Path $installDir 'runtime\bin')"之后就可以双击打开h5文件了
到此这篇关于使用HDFView预览HDF5文件的详细操作的文章就介绍到这了,更多相关HDFView预览HDF5文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
利用Python实现Windows下的鼠标键盘模拟的实例代码
本篇文章主要介绍了利用Python实现Windows下的鼠标键盘模拟的实例代码,具有一定的参考价值,有兴趣的可以了解一下2017-07-07


最新评论