0
意思是,我創建了以下數據框:大熊貓計算每月
availability = pd.DataFrame(propertyAvailableData).set_index("createdat")
monthly_availability = availability.fillna(value=0).groupby(pd.TimeGrouper(freq='M'))
這讓下面的輸出
2015-08-18 2015-09-09 2015-09-10 2015-09-11 2015-09-12 \
createdat
2015-08-12 1.0 1.0 1.0 1.0 1.0
2015-08-17 0.0 0.0 0.0 0.0 0.0
2015-08-18 0.0 1.0 1.0 1.0 1.0
2015-08-18 0.0 0.0 0.0 0.0 0.0
2015-08-19 0.0 1.0 1.0 1.0 1.0
2015-09-03 0.0 1.0 1.0 1.0 1.0
2015-09-03 0.0 1.0 1.0 1.0 1.0
2015-09-07 0.0 0.0 0.0 0.0 0.0
2015-09-08 0.0 0.0 0.0 0.0 0.0
2015-09-11 0.0 0.0 0.0 0.0 0.0
我試圖做得到平均每一個月在創建:
monthly_availability_mean = monthly_availability.mean()
但是,在這裏我得到以下輸出:
2015-08-18 2015-09-09 2015-09-10 2015-09-11 2015-09-12 \
createdat
2015-08-31 0.111111 0.444444 0.666667 0.777778 0.777778
2015-09-30 0.000000 0.222222 0.222222 0.222222 0.222222
2015-10-31 0.000000 0.000000 0.000000 0.000000 0.000000
當我用手檢查八月,我得到:
1.0 + 0 + 0 + 0 + 0/5 = 0.2
如何獲得每月平均正確?
嗯,對我來說它很好。也許索引不排序,並有另一行 - 嘗試'df = df.sort_index()' – jezrael
謝謝!我嘗試過: 'availability = pd.DataFrame(propertyAvailableData).set_index(「createdat」)' 'availability = availability.sort_index()' 'monthly_availability = availability.fillna(value = 0).groupby(pd.TimeGrouper (freq ='M'))' 但仍然得到相同的結果 – Bunker
我認爲你需要'sort_index'來更好地檢查數據,因爲它似乎還有另外一個帶有8月索引的行。或者你的短樣本也存在問題? – jezrael