0
我有一個帶時間戳列的dask數據框,我需要從中獲取星期幾和星期幾。轉換後的Dask`.dt`
這裏是DDF建設
dfs = [delayed(pd.read_csv)(path) for path in glob('../data/20*.zip')]
df = dd.from_delayed(dfs)
meta = ('starttime', pd.Timestamp)
df['start'] = df.starttime.map_partitions(pd.to_datetime, meta=meta)
現在,如果我使用類似 df.head(10).dt.year
,它的工作原理(返回爲一年)。這意味着datacol被轉換。
但是,當我試圖讓一個新列,它提出了一個錯誤: df['dow'] = df['start'].dt.dayofweek
(或任何其他「.DT」選項,對於這個問題):
AttributeError: 'Series' object has no attribute 'dayofweek'
缺少什麼我在這裏?
請注意,您也可以執行'ddf ['C'] = dd.to_datetime(ddf.B)'而不是使用'map_partitions'。 –