# 使用python快速查看hdf5文件

1,922 阅读1分钟

hdf5不支持用其他的浏览器打开,推荐写一段代码来进行读取,看看里面到底有哪些数据集。代码如下:

# 读取HDF5文件中的所有数据集
def traverse_datasets(hdf_file):
    import h5py

    def h5py_dataset_iterator(g, prefix=''):
        for key in g.keys():
            item = g[key]
            path = '{}/{}'.format(prefix, key)
            if isinstance(item, h5py.Dataset): # test for dataset
                yield (path, item)
            elif isinstance(item, h5py.Group): # test for group (go down)
                yield from h5py_dataset_iterator(item, path)

    with h5py.File(hdf_file, 'r') as f:
        for (path, dset) in h5py_dataset_iterator(f):
            print(path, dset)

    return None

# 传入路径即可
traverse_datasets('datasets/train_catvnoncat.h5')

输出结果如图:在这里插入图片描述


> 本文使用 [文章同步助手](https://juejin.cn/post/6940875049587097631) 同步