我的數據可能在給定日期有多個事件,或者在某個日期沒有事件。我採取這些事件,按日期計算並繪製它們。但是,當我繪製它們時,我的兩個系列並不總是匹配。將缺失的日期添加到熊貓數據框中
idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max())
s = df.groupby(['simpleDate']).size()
在上面的代碼IDX成爲範圍的說30個日期。 09-01-2013至09-30-2013 但是S可能只有25或26天,因爲在給定日期沒有發生任何事件。然後我得到一個AssertionError的尺寸不匹配時,我嘗試繪圖:
fig, ax = plt.subplots()
ax.bar(idx.to_pydatetime(), s, color='green')
什麼來解決這個正確的方法是什麼?我想從IDX或(我寧願這樣做)中刪除沒有數值的日期,並將計數爲0的日期添加到系列中。我寧願使用0值的30天完整圖表。如果這種方法是正確的,有關如何開始的任何建議?我需要某種動態reindex
功能嗎?
這裏的小號(df.groupby(['simpleDate']).size()
)的片段,發現沒有條目04和05
09-02-2013 2
09-03-2013 10
09-06-2013 5
09-07-2013 1
哇謝謝!我並不完全瞭解重建索引的效果。 – KHibma
'reindex'是一個了不起的功能。它可以(1)重新排序現有數據以匹配一組新標籤,(2)插入之前沒有標籤的新行,(3)填充丟失標籤的數據(包括前向/後向填充)(4)選擇行按標籤! – unutbu
@unutbu這回答我也有一個問題的一部分,謝謝!但是想知道你是否知道如何動態地創建包含事件日期的列表? –