我有一個如下的數據集。我們只有一個月的最後一天的數據,我試圖插入其餘部分,這是否正確?Python熊貓數據幀插入缺失數據
Date Australia China
2011-01-01 NaN NaN
2011-01-02 NaN NaN
- - -
- - -
2011-01-31 4.75 5.81
2011-02-01 NaN NaN
2011-02-02 NaN NaN
- - -
- - -
2011-02-28 4.75 5.81
2011-03-01 NaN NaN
2011-03-02 NaN NaN
- - -
- - -
2011-03-31 4.75 6.06
2011-04-01 NaN NaN
2011-04-02 NaN NaN
- - -
- - -
2011-04-30 4.75 6.06
對於插值這個數據幀尋找失蹤NaN值我使用下面的代碼
import pandas as pd
df = pd.read_csv("data.csv", index_col="Date")
df.index = pd.DatetimeIndex(df.index)
df.interpolate(method='linear', axis=0).ffill().bfill()
但我得到一個錯誤「類型錯誤:無法與所有NaN的插值。」
這裏可能有什麼問題,我該如何解決這個問題?
謝謝。
該錯誤是不言自明的。你可以嘗試按照這個http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html – station
刪除NaN嗨,感謝您的幫助,而不是NaN我可以填寫什麼那些行? – Unnikrishnan
@Unnikrishnan我想,已經給出了很好的答案。您的數據非常稀少,因此您可能需要質疑實際插入大量數據是否是個好主意。你有多確定這些數值會有點正確? –