2015-07-20 33 views
0

我有一個很大的數據框使用日期(日期時間格式),並與類別的項目:的Python:做圖用「一年中的哪一天」

例:

日期;類別; Item

2015-05-13 23:53:00;一個 ;乙

我想通過「一年中的哪一天」(有多少項目在聖誕節天,不依賴於年)

到目前爲止,我已經創建,使項目數的積在新的一列「DAYOFYEAR」含「月日」的字符串形式(例如:12-24),我有這個屬性進行分組計數的項目數

df = df[['Category','DayOfYear']].groupby(['DayOfYear']).count() 

它給了我一個表,該表離我想要的不遠:

> DayOfYear; Category 
> 1-1 ; 1801 
> 1-10 ; 4829 
> 1-11 ; 4971 
> 1-12 ; 3964 
> 1-13 ; 3116 

但後來當我把它變成一個曲線圖,它是胡說八道:所以它是在錯誤的順序

如何做到這一點任何想法排序DAYOFYEAR並不反映的日期?我應該保持日期時間格式嗎?

+0

您是否已經在使用'pandas'?如果你放入可剪切的樣本數據,這將更有意思。 – cphlewis

+0

是的,我正在使用熊貓,至於它來自Kaggle競賽的數據,所以我不確定我是否被允許:( –

+0

?但它可以在stackoverflow上尋求幫助? – cphlewis

回答

0

我已經找到一種方法來做到這一點:)

而是建立一個字符串,月,日的我加了一個列有格式的日期時間%M-%d

然後我有將數據分組以計算一年中每一天的物品數量,並根據這些分組數據製作物品數量圖