0
dask文檔指出:「BColz是一個磁盤上,分塊,壓縮的列存儲,這些屬性對dask.dataframe非常有吸引力,它可以在其上運行得非常好。一個特殊的from_bcolz函數「。以bcolz格式保存dask數據幀
但是,我找不到一個例子如何保存 dask數據幀到bcolz。推薦的方法是什麼?
dask文檔指出:「BColz是一個磁盤上,分塊,壓縮的列存儲,這些屬性對dask.dataframe非常有吸引力,它可以在其上運行得非常好。一個特殊的from_bcolz函數「。以bcolz格式保存dask數據幀
但是,我找不到一個例子如何保存 dask數據幀到bcolz。推薦的方法是什麼?
我創建了一個拉取請求來實現這個。直到它被合併到主分支,你可以在這裏找到:
https://github.com/dask/dask/pull/1386
如果你不想編輯自己的DASK實現,你可以只複製to_bcolz
方法。
一個可能的解決方案可能是將dask數據幀轉換爲dask數組,如此處所述(http://stackoverflow.com/q/37444943/5082048),並將其保存爲bcolz,如此處所述(http:// dask .pydata.org/EN /最新/陣列creation.html#商店DASK陣列) –