文章目录
- save
- load
- savez
- savez_compressed
Numpy
提供了以.npy
为后缀的文件存储方案,与这种文件格式密切相关的读、写函数分别是np.load
和np.save
。通过savez
可以一次性存储多个数组,并可通过load
以键值对的形式读取出来;如果觉得文件太大,可以通过savez_compressed
进行压缩。
save
save
函数的定义为
numpy.save(file, arr, allow_pickle=True, fix_imports=True)
其中file
为文件路径,若不以.npy
为结尾,则自动添加.npy
后缀;arr
为待存储数据。allow_pickle
为True
时,允许通过Python自带的pickle
来存储对象;fix_import
为True
时,pickle
将为旧的Python2数据尽量匹配成Python3的。
import numpy as np
x = np.arange(10000)
np.save("test", x)
# x被存储为`test.npy`
load
用于读取numpy
文件的load
函数定义如下
numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding='ASCII', *, max_header_size=10000)
其中file
是文件名,encoding
为编码方式,这没什么好说的;allow_pickle, fix_imports
和save
中相同。max_header_size
为头文件尺寸,表示读取时跳过的内容。
map_mode
为内存映射模式,可选r+, r, w+, c
。
通过load
,可以将刚刚存储的test.npy
读取出来
y = np.load("test.npy")
(x==y).all()
# 返回True,说明x和y全等
savez
save
只能存储一个数组对象,多了会忽略;savez
则解决了这个问题
np.save("xy", x,y,y)
test = np.load('xy.npy')
print(test) #[ 0 1 2 ... 9997 9998 9999]
print(len(test)) # 10000
np.savez("xy", x, y)
test = np.load('xy.npz')
print(test.files)
# ['arr_0', 'arr_1']
print(test['arr_0'])
# [ 0 1 2 ... 9997 9998 9999]
即savez
将多个数组存入到了文件中。
savez
在存储文件时,字典的键值是可以更改的
np.savez("xy", x=x, Y=y)
test = np.load('xy.npz')
print(test.files)
# ['x', 'Y']
savez
的运行逻辑,是先将每一个数组存为npy
之后,再将这些npy
压缩为zip
文件,最后在zip
文件外面套一层npz
的壳。所以通过savez
存储的文件,在被load
之后,得到的是一个NpzFile
对象,其中包含了zip
属性,在这个属性中,可以看到arr_0.npy
和arr_1.npy
的信息。
>>> print(test.zip.NameToInfo)
{'arr_0.npy': <ZipInfo filename='arr_0.npy' filemode='?rw-------' file_size=40128>, 'arr_1.npy': <ZipInfo filename='arr_1.npy' filemode='?rw-------' file_size=40128>}
savez_compressed
savez_compressed
和savez
的唯一区别就是,前者有压缩。
刚刚通过savez
存储的文件有79kb,但x
和y
其实是相同的内容,这样存储十分奢侈,
np.savez_compressed('xyc', x, y)
最后得到的xyc
只有28kb,可以说是很划算了。