NumPy IO
Numpy 可以讀寫磁片上的文本數據或二進位數據。
NumPy 為 ndarray 對象引入了一個簡單的檔格式:npy。
npy 檔用於存儲重建 ndarray 所需的數據、圖形、dtype 和其他資訊。
常用的 IO 函數有:
- load() 和 save() 函數是讀寫檔數組數據的兩個主要函數,默認情況下,數組是以未壓縮的原始二進位格式保存在擴展名為 .npy 的檔中。
- savze() 函數用於將多個數組寫入檔,默認情況下,數組是以未壓縮的原始二進位格式保存在擴展名為 .npz 的檔中。
- loadtxt() 和 savetxt() 函數處理正常的文本檔(.txt 等)
numpy.save()
numpy.save() 函數將數組保存到以 .npy 為擴展名的檔中。
numpy.save(file, arr, allow_pickle=True, fix_imports=True)
參數說明:
- file:要保存的檔,擴展名為 .npy,如果檔路徑末尾沒有擴展名 .npy,該擴展名會被自動加上。
- arr: 要保存的數組
- allow_pickle: 可選,布爾值,允許使用 Python pickles 保存對象數組,Python 中的 pickle 用於在保存到磁片檔或從磁片檔讀取之前,對對象進行序列化和反序列化。
- fix_imports: 可選,為了方便 Pyhton2 中讀取 Python3 保存的數據。
實例
import numpy as np
a = np.array([1,2,3,4,5])
# 保存到 outfile.npy 檔上
np.save('outfile.npy',a)
# 保存到 outfile2.npy 檔上,如果檔路徑末尾沒有擴展名 .npy,該擴展名會被自動加上
np.save('outfile2',a)
我們可以查看檔內容:
$ cat outfile.npy ?NUMPYv{'descr': '<i8', 'fortran_order': False, 'shape': (5,), } $ cat outfile2.npy ?NUMPYv{'descr': '<i8', 'fortran_order': False, 'shape': (5,), }
可以看出檔是亂碼的,因為它們是 Numpy 專用的二進位格式後的數據。
我們可以使用 load() 函數來讀取數據就可以正常顯示了:
實例
import numpy as np
b = np.load('outfile.npy')
print (b)
輸出結果為:
[1 2 3 4 5]
np.savez
numpy.savez() 函數將多個數組保存到以 npz 為擴展名的檔中。
numpy.savez(file, *args, **kwds)
參數說明:
- file:要保存的檔,擴展名為 .npz,如果檔路徑末尾沒有擴展名 .npz,該擴展名會被自動加上。
- args: 要保存的數組,可以使用關鍵字參數為數組起一個名字,非關鍵字參數傳遞的數組會自動起名為 arr_0, arr_1, … 。
- kwds: 要保存的數組使用關鍵字名稱。
實例
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
b = np.arange(0, 1.0, 0.1)
c = np.sin(b)
# c 使用了關鍵字參數 sin_array
np.savez("zaixian.npz", a, b, sin_array = c)
r = np.load("zaixian.npz")
print(r.files) # 查看各個數組名稱
print(r["arr_0"]) # 數組 a
print(r["arr_1"]) # 數組 b
print(r["sin_array"]) # 數組 c
輸出結果為:
['sin_array', 'arr_0', 'arr_1'] [[1 2 3] [4 5 6]] [0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9] [0. 0.09983342 0.19866933 0.29552021 0.38941834 0.47942554 0.56464247 0.64421769 0.71735609 0.78332691]
savetxt()
savetxt() 函數是以簡單的文本檔格式存儲數據,對應的使用 loadtxt() 函數來獲取數據。
np.loadtxt(FILENAME, dtype=int, delimiter=' ') np.savetxt(FILENAME, a, fmt="%d", delimiter=",")
參數 delimiter 可以指定各種分隔符號、針對特定列的轉換器函數、需要跳過的行數等。
實例
import numpy as np
a = np.array([1,2,3,4,5])
np.savetxt('out.txt',a)
b = np.loadtxt('out.txt')
print(b)
輸出結果為:
[1. 2. 3. 4. 5.]
使用 delimiter 參數:
實例
import numpy as np
a=np.arange(0,10,0.5).reshape(4,-1)
np.savetxt("out.txt",a,fmt="%d",delimiter=",") # 改為保存為整數,以逗號分隔
b = np.loadtxt("out.txt",delimiter=",") # load 時也要指定為逗號分隔
print(b)
輸出結果為:
[[0. 0. 1. 1. 2.] [2. 3. 3. 4. 4.] [5. 5. 6. 6. 7.] [7. 8. 8. 9. 9.]]