我正在查詢我的數據庫以顯示過去一週的記錄。然後我彙總數據並將其轉換爲Python和熊貓到DataFrame中。 在此表中,我試圖說明過去7周內每天發生的情況,但是在某些日子裏沒有發生任何事件。在這些情況下,日期完全缺失。我正在尋找一種方法來追加不存在的日期(但它們是查詢中指定的日期範圍的一部分),這樣我就可以填充任何希望存在其他缺失列的值。日期範圍填寫日期範圍和fillna
在一些試驗中,我將數據設置爲熊貓數據框,其中日期是索引,而其他日期是列。我最好將日期作爲頂部索引 - 所以按名稱,堆棧購買和send_back分組,並且日期是'列'。
以下是我找的數據幀現在怎麼看一個例子,:在查詢設置
日期 - 2016年8月1日 - 2016年8月8日。數據框看起來鏈接纔可這樣:
| dates | name | purchase | send_back
0 01.08.2016 Michael 120 0
1 02.08.2016 Sarah 100 40
2 04.08.2016 Sarah 55 0
3 05.08.2016 Michael 80 20
4 07.08.2016 Sarah 130 0
後:
| dates | name | purchase | send_back
0 01.08.2016 Michael 120 0
1 02.08.2016 Sarah 100 40
2 03.08.2016 - 0 0
3 04.08.2016 Sarah 55 0
4 05.08.2016 Michael 80 20
5 06.08.2016 - 0 0
6 07.08.2016 Sarah 130 0
7 08.08.2016 Sarah 0 35
8 08.08.2016 Michael 20 0
打印如下:
df.index
給出:
'Index([ u'dates',u'name',u'purchase',u'send_back'],
dtype='object')
RangeIndex(start=0, stop=1, step=1)'
我明白任何指導。
感謝的方式。我嘗試過,但我得到一個錯誤KeyError'日期'。所以儘管它沒有識別索引名稱(參見上文,我在主要問題中添加了信息)。我在熊貓和python領域有點新手,所以我真的不確定問題在哪裏。 – OAK
@OAK MaxU將數據框的索引設置爲'date'列。他從你發佈的文本中推斷出它的存在。我們都在你的數據框中看到'date'。您得到的錯誤必須來自「date」已在索引中的事實。嘗試從MaxU的代碼中去除'.set_index('dates')'。 – piRSquared
@piRSquared,謝謝! – MaxU