2017-09-13 118 views
0

我想在我的數據集中填充丟失的數據,我的導師建議我在Python中使用Fancy Impute包,特別是MICE算法。 首先,當我讀到MICE的時候,很清楚,如果我的缺失數據不是隨機的(我懷疑這是因爲缺失數據更可能在特定的國家/年),這是一個糟糕的選擇。那麼有沒有人推薦一種不同的算法? (我的項目基於世界銀行性別統計數據)。在Python中使用Fancy Impute的MICE算法時出現TypeError

的技術問題: 我跑我的數據框驗證碼:

filled = MICE().complete(dfvars) 

但我得到這個錯誤,我的導師不知道是什麼感覺一下,我還沒有發現任何其他論壇討論小鼠在蟒蛇都:

TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe'' 
+0

這裏有兩個問題。請編輯只詢問一個問題 – blueCat

回答

0

遇到錯誤,因爲MICE僅用來推諉數字數據,如果數據集包含分類數據,但要歸咎於數字數據,你應該只使用數據框的數字列。如果分類數據丟失,則不得不使用不同的算法。

相關問題