1
我有一個大型圖像數據集來存儲。我有30萬張圖片。每個圖像是28800個像素的矢量,這意味着我有(300000, 28800)
如何存儲和加載巨大的圖像數據集?
我存儲,作爲遵循
img_arr = np.stack(images, axis=0)
np.savetxt('pixels_dataset_large.csv',img_arr,delimiter=",")
然而它需要較長時間來加載它和一些倍升得到存儲器錯誤的矩陣:
有沒有其他的選擇來優化存儲和加載它?
'np.save' /'np.load'有什麼問題?它將數據保存在內存中,因此不會涉及任何分析,並且該過程將與磁盤允許的速度一樣快。 –
@ivan_pozdeev,l只有在加載時纔有probelm。當我嘗試np.load()l得到TypeError:load()得到了一個意外的關鍵字參數'dtype' – vincent
這意味着你正在使用'load'不正確。 [它沒有'dtype'參數](https://docs.scipy.org/doc/numpy/reference/generated/numpy.load.html)。 –