我有一個有83列4000行的熊貓數據框。我打算將這些數據用於邏輯迴歸,因此希望將我的列縮小到那些缺少數據丟失量最少的列。如何獲得熊貓數據幀列中的NaN迷戀頻率
爲此,我正在考慮根據NaN觀測的頻率對它們進行排名。我嘗試了一些東西,如
econ_balance["BG.GSR.NFSV.GD.ZS"].describe()
econ_balance["BG.GSR.NFSV.GD.ZS"].value_counts
econ_balance["BG.GSR.NFSV.GD.ZS"]["NaN"]
econ_balance["BG.GSR.NFSV.GD.ZS"][NaN]
沒有一個似乎工作。我總是嘗試使用Google搜索來查看這個問題是否已經回答,但沒有運氣。
在此先感謝您的幫助
喬希
df.isnull()。sum() http://stackoverflow.com/questions/26266362/how-to-count-the-nan-values-in-the-column-in-panda-data-框架 – 2015-04-01 19:13:43
Jeez我突然獲得了立即重複的近距離投票 – EdChum 2015-04-01 19:18:53