H5文件全稱是Hierarchical Data Format,可以存儲不同類型的圖像和數碼數據的文件格式,是一種常用的數據存儲格式。python中用於讀寫H5文件的包是h5py。下面簡要介紹其操作:
讀取:
import h5pypath = 'Data/irt_PROSIT.hdf5' # 這裡是h5文件的存儲路徑f = h5py.File(path, 'r')
查看該文件包含的那些數據
list(f.keys())# ['X_holdout', 'X_train', 'X_val', 'Y_holdout', 'Y_train', 'Y_val']
抽取某個數據:
data = f['X_val']
需要的時候可以把他轉化為numpy格式
import numpy as npdata = np.array(data)
寫入:
import pandas as pdf=h5py.File("new.hdf5","w")new_data = pd.DataFrame(np.zeros((10,10))) # 隨意建立的數據f.create_dataset("mydataset", new_data)