我試圖重新索引一個數據幀相對於索引的第二級。我有一個數據框,第一級索引是用戶ID,第二級是日期。例如:大熊貓馴化MultiIndex相對於任意級別
pd.DataFrame({
'id': 3*['A'] + 5*['B'] + 4*['C'],
'date': ['01-01-2010', '02-01-2010', '12-01-2010',
'04-01-2015', '05-01-2015', '03-01-2016', '04-01-2016', '05-01-2016',
'01-01-2015', '02-01-2015', '03-01-2015', '04-01-2015'],
'value': np.random.randint(10,100, 12)})\
.set_index(['id', 'date'])
我想重新索引日期填寫缺少的日期,但只適用於最大和最小日期之間的日期爲每個「ID」組。
例如,用戶「A」應該在2010年1月至12月間連續提供每月數據,用戶「B」應該在2015年4月至2016年5月間持續使用日期。爲簡單起見,我們假設我想用零填充NaN。
其他與此相似的問題假設我想爲所有用戶使用相同的date_range,但在此用例中不起作用。有任何想法嗎?
這很接近,但我不需要每日數據。我每月都需要它。不幸的是,將「D」更改爲「M」不起作用,因爲它提供了月結束日期(沒有數據,因此您只能得到全零「 – Charles
並且如果使用'MS'而不是'M'? – jezrael
完美工作。謝謝! – Charles