是否有可能遍歷dask GroupBy對象以訪問基礎數據框?我想:遍歷dask中的GroupBy對象
import dask.dataframe as dd
import pandas as pd
pdf = pd.DataFrame({'A':[1,2,3,4,5], 'B':['1','1','a','a','a']})
ddf = dd.from_pandas(pdf, npartitions = 3)
groups = ddf.groupby('B')
for name, df in groups:
print(name)
然而,這將導致一個錯誤:KeyError: 'Column not found: 0'
更廣泛地說,什麼樣的互動也將DASK的GroupBy對象允許,除了從適用的方法?
我很高興地發現get_group()方法已經實現。 –
你的代碼適合我, –
@StevenG感謝您的反饋。也許有一個問題,我的設置 –