2013-12-14 39 views
1

我得到了一個數據集(每日和每月的降雨量數據),但缺少如此多的價值。 爲了訓練我需要填補缺失數據的數據,你能告訴我該怎麼辦?我用SPSS統計,但看起來價值不好,或者我做錯了方法。如何從Matlab或Excel中填寫缺失的數據集

sample: 
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 
3 3 5 5 6 7 8 7 8 9 NaN 4 
NaN 3 NaN 5 NaN 3 4 NaN 4 6 7  8 
7 NaN 4 7 8 9 4 2 NaN 4 6  5 
..................................................... 

另一個問題是,大多數訓練前的數據應該是歸一化的數據,這是正確的嗎? 謝謝你的回答! 聖誕快樂!

+0

您可能想看看MATLAB曲線擬合工具箱。 – Motes

+0

到目前爲止您嘗試了什麼?請向我們展示您的代碼,也許這只是一個小錯誤。 – Daniel

回答

1

對於缺失的數據,您可以選擇現有數據的mean來模擬丟失的數據。例如,您拿mean(3, 7) = 5填寫NaN,Jan等等。我認爲這可能是最簡單的方法。你也可以考慮矩陣分解和曲線擬合。

對於規範化,一些分類器不需要規範化的數據。但是,將數據標準化通常是提高性能的良好實踐。對於神經網絡,衆所周知,歸一化數據非常受歡迎。所以不要猶豫,去做吧。

0

出版社Ctrl+G,然後點擊Special,然後檢查Formulas,然後確保只有Errors被選中,然後單擊OK。這將選擇所有有錯誤的單元格。然後您可以按Delete清除其內容。

我有時會使用公式將一個表的值轉換爲原始值或更易於管理的公式來創建第二個表,如建議here