dask中根據多個條件選擇行的最高性能方法是什麼?在熊貓中,像基於dask中的多個條件的行選擇?
df[df.A > 0 & df.B <= 10]
確實有效。然而,在dask中,這將返回一個錯誤。我想出了迄今爲止最好的解決辦法是使用numpys logical_and()
功能:
df[np.logical_and(df.A > 0, df.B <= 10)]
然而,這是超級慢,因爲它會觸發一些計算(我認爲)。有沒有更多的高性能方式來選擇dask基於多個條件的行?
dask中根據多個條件選擇行的最高性能方法是什麼?在熊貓中,像基於dask中的多個條件的行選擇?
df[df.A > 0 & df.B <= 10]
確實有效。然而,在dask中,這將返回一個錯誤。我想出了迄今爲止最好的解決辦法是使用numpys logical_and()
功能:
df[np.logical_and(df.A > 0, df.B <= 10)]
然而,這是超級慢,因爲它會觸發一些計算(我認爲)。有沒有更多的高性能方式來選擇dask基於多個條件的行?
由於@joris的提示,括號在正確的位置工作。因此,在DASK溶液是類似/等同於大熊貓溶液:
df[(df.A > 0) & (df.B <= 10)]
上面也不會在熊貓工作,你需要括號:''DF [(df.A> 0)&(df.B < = 10)]' – joris