使用HDFView预览HDF5文件的详细操作

 更新时间:2026年06月25日 09:57:08   作者:Achuan-2  
HDF5,全称是 Hierarchical Data Format version 5 (层次式数据格式第五代),可以理解成一种适合存储复杂科学数据的文件格式,这篇文章主要介绍了使用HDFView预览HDF5文件的详细操作,需要的朋友可以参考下

 最近在处理一些数据文件时,经常会遇到 .h5​、.hdf5​ 这类后缀的文件。

如果只是想确认文件里有什么数据、有哪些字段、数组维度是多少,直接写代码读当然可以,但有点麻烦。更方便的办法是先用一个可视化工具打开看看。

这里简单介绍一下 HDF5 格式,以及一个常用的 HDF5 查看工具:HDFView。

什么是 HDF5 数据格式?

HDF5,全称是 Hierarchical Data Format version 5 (层次式数据格式第五代),可以理解成一种适合存储复杂科学数据的文件格式。

它和普通的 CSV、Excel 不太一样。

CSV 更像是一张二维表,而 HDF5 更像是一个“小型文件系统”。一个 HDF5 文件里面可以有目录、数据集、属性等结构。

比如一个 .h5​ 文件内部可能长这样:

/
├── images
│   ├── train
│   └── test
├── labels
├── metadata
└── config

其中:

‍✦ Group:类似文件夹,用来组织数据

‍✦ Dataset:真正存储数据的地方,比如矩阵、数组、图像、时间序列

‍✦ Attribute:附加信息,比如单位、采样率、实验条件、数据说明

所以 HDF5 很适合用来保存:

‍✦ 科研实验数据

‍✦ 大规模矩阵

‍✦ 图像数据集

‍✦ 深度学习训练数据

‍✦ 传感器时间序列

‍✦ 仿真结果

‍✦ 生物信息学数据

它的一个优点是可以把很多相关数据放在同一个文件里,而且结构比较清晰。缺点是,如果没有专门工具,直接双击是看不了的。

什么是 HDFView?

虽然我们可以使用 Python 或 MATLAB 代码来查看 HDF5 文件的结构,但是比较麻烦。

HDFView 是 HDF Group 官方推出的一款基于 Java 的跨平台图形化浏览器。

GitHub地址:https://github.com/HDFGroup/hdfview

使用 HDFView,你可以:

‍✦ 以树状目录结构直观地浏览 HDF5 文件的组、数据集和属性。

‍✦ 双击数据集直接以表格形式查看具体数值。

HDFView 的安装步骤

HDFView 的官方开源仓库位于:HDFGroup/hdfview。

1. 下载安装包

‍1. 访问 HDFView 在 GitHub 的发布页面:HDFView Releases。

‍2. 在最新的 Release 版本(例如 3.4.1 或更高)下,根据你的操作系统下载对应的安装包:

‍ ‍ ○ Windows:下载 .msi​ 安装包(例如 HDFView-3.4.1-Windows.msi​)。

‍ ‍ ○ macOS:下载 .dmg​ 镜像

‍ ‍ ○ Linux:下载 .tar.gz​ 压缩包。

2. 安装过程

‍✦ Windows:双击运行 .msi​ 引导程序,按照提示一路点击“Next”即可。默认会安装在 C:\Users\<用户名>\AppData\Local\HDFView\​。

‍✦ macOS:双击 .dmg​ 文件,将 HDFView 图标拖入应用程序(Applications)文件夹。

‍✦ Linux:解压压缩包,运行解压目录下的启动脚本。

HDFView如何使用

用HDFView打开一个文件后,

左侧是树状视图,可以查看文件夹和数据集层级,右侧是数据的属性信息,主要看维度信息和数据存储格式信息

双击左侧的数据集可以预览数据内容

常见问题

Windows 启动报错 "failed to launch jvm" 怎么办?

这是 Windows 用户在安装后最常遇到的启动错误。

为什么会报错呢?

这是因为 HDFView 运行需要依赖其内置的 Java 虚拟机(JVM)和 HDF5 动态链接库(DLL)。如果你的电脑上安装了 Miniforge/Anaconda (Python 环境) 或 MATLAB 等同样自带 HDF5 库的软件,并且它们在系统环境变量 PATH​ 中排在前面,Windows 就会错误地去调用这些软件的 DLL,从而导致 JVM 启动失败。

完美的解决办法

‍1. 打开 PowerShell。

‍2. 粘贴并运行以下代码(它会自动为 HDFView 注入局部环境变量,解决冲突):

$p = "C:\Users\Achuan-2\AppData\Local\HDFView" # 替换为你的实际安装目录
$exePath = Get-ChildItem -Path $p -Filter "HDFView.exe" -Recurse -ErrorAction SilentlyContinue | Select-Object -First 1
$installDir = $exePath.DirectoryName
$regPath = "HKCU:\Software\Microsoft\Windows\CurrentVersion\App Paths\HDFView.exe"
if (-not (Test-Path $regPath)) { New-Item -Path $regPath -Force | Out-Null }
Set-ItemProperty -Path $regPath -Name "(Default)" -Value $exePath.FullName
Set-ItemProperty -Path $regPath -Name "Path" -Value "$(Join-Path $installDir 'app');$(Join-Path $installDir 'runtime\bin')"

之后就可以双击打开h5文件了

到此这篇关于使用HDFView预览HDF5文件的详细操作的文章就介绍到这了,更多相关HDFView预览HDF5文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中循环语句while用法实例

    python中循环语句while用法实例

    这篇文章主要介绍了python中循环语句while用法,实例分析了while语句的使用方法,需要的朋友可以参考下
    2015-05-05
  • python将原图裁剪为固定尺寸小图

    python将原图裁剪为固定尺寸小图

    这篇文章主要为大家详细介绍了python将原图裁剪为固定尺寸小图,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-04-04
  • Python使用psutil获取系统信息

    Python使用psutil获取系统信息

    这篇文章介绍了Python使用psutil获取系统信息的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-05-05
  • Python yield 的使用浅析

    Python yield 的使用浅析

    这篇文章主要为大家详细介绍了Python yield的使用,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-02-02
  • 利用Python实现Windows下的鼠标键盘模拟的实例代码

    利用Python实现Windows下的鼠标键盘模拟的实例代码

    本篇文章主要介绍了利用Python实现Windows下的鼠标键盘模拟的实例代码,具有一定的参考价值,有兴趣的可以了解一下
    2017-07-07
  • Django实战之用户认证(初始配置)

    Django实战之用户认证(初始配置)

    这篇文章主要介绍了Django实战之用户认证(初始配置),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-07-07
  • Python中iter函数的具体使用

    Python中iter函数的具体使用

    Python中iter函数用于创建迭代器对象,可以遍历可迭代对象的元素,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-01-01
  • wxpython中Textctrl回车事件无效的解决方法

    wxpython中Textctrl回车事件无效的解决方法

    这篇文章主要介绍了wxpython中Textctrl回车事件无效的解决方法,较为详细的分析了TextCtrl支持的事件类型,并给出了TextCtrl绑定回车事件的相应实现技巧,需要的朋友可以参考下
    2016-07-07
  • 用Python实现换行符转换的脚本的教程

    用Python实现换行符转换的脚本的教程

    这篇文章主要介绍了用Python实现换行符转换的脚本的教程,代码非常简单,包括一个对操作说明的功能的实现,需要的朋友可以参考下
    2015-04-04
  • python读取txt文件并逐行输出字符串

    python读取txt文件并逐行输出字符串

    Python提供了简单且方便的方法来读取txt文件,使用open()函数和readlines()方法逐行输出文件中的字符串内容,我们可以轻松地读取文件内容,并通过循环遍历的方式逐行处理,读取txt文件的方法在各种应用场景中非常常见,可以用于数据分析、文本处理、日志分析等
    2023-10-10

最新评论