3
我正在研究一個具有24個vCPU的Google雲計算實例。運行的代碼如下使用Dask中的所有內核
import dask.dataframe as dd
from distributed import Client
client = Client()
#read data
logd = (dd.read_csv('vol/800000test', sep='\t', parse_dates=['Date'])
.set_index('idHttp')
.rename(columns={'User Agent Type':'UA'})
.categorize())
當我運行它(這也是後數據分析,我加載數據後做的情況下),我可以看到使用11個芯,有時4.
有什麼辦法可以更好地控制這個,並充分利用核心?
圖片看起來很不錯。我可以知道如何繪製上面的圖片嗎? –