2016-11-15 109 views
1

我有一個有一個日期時間列的熊貓數據框。我按日期分組,然後按以下方式分組:重新命名熊貓列後羣by天和小時

df.groupby([df['date'].map(lambda t: t.day), df['date'].map(lambda t: t.hour)]).count() 

不幸的是,這給我留下了雙重索引,都稱爲日期。第一日爲當月的一天,第二個日期是小時,字節是在小時的項目數:

enter image description here

我想利用這些日期列,但不能。我試過正在重置索引,但收到此錯誤:

ValueError: cannot insert date, already exists 

我也因爲「日期」並不在列列表中出現不能重命名列:

grouped_df.columns 
>> Index([u'bytes'], dtype='object') 

最終,我試圖找出每天每個小時內的物品數量。我如何重命名重複日期列?我應該使用不同的方法來分組數據框以避免這種困境嗎?

回答

3

餘did't測試,但這樣的事情應該工作:

df.groupby([df['date'].rename("day").map(lambda t: t.day), df['date'].rename("hour").map(lambda t: t.hour)]).count() 
+0

就像一個魅力。謝謝! – marie