2013-06-19 122 views
-1

我使用的數據看起來如下所示,它有50000個實例和32個變量.... 缺少的值存在於很多變量中,.. 抱歉,無法發佈整個數據..如何解決R中的警告

我用

library(zoo) 
    d$V5 <- na.locf(d$V5) 

和我進一步檢查基尼價值,它給我的輸出如下

Gini(d$V5) 
[1] NA 
Warning messages: 
1: In sum(x * 1:n) : Integer overflow - use sum(as.numeric(.)) 
2: In n * sum(x) : NAs produced by integer overflow 

但是d $ V5對應的年齡是一個數字 目標是找到基尼和信息增益並繪製決策樹,由於缺少值決策樹分裂是一個。因此,填寫缺失值是必要的。 數據:

1 022 F O 044 0  N 31 12 00P   0012 Y Y N Y 0048 731 0.000000 Y N 0 VERA LUCIA N N 300.000000 0000 00 N 0 
2 015 F S 018 0  Y 31 20 00 P 0216 Y Y Y Y 0012 853 0.000000 Y N 0 SARA FELIPE N N 300.000000 0000 00 N 0 
3 024 F C 022 0  Y 31 08 00 P 0048 Y N Y Y 0012 040 0.000000 Y N 0 HELENA DOMINGOS SOGRA N N 229.000000 0000 00 N 0 
4 012 F C 047 0  N 31 25 00 P 0180 Y Y N Y 0024 035 0.000000 Y N 0 JACI VALERIA ALEXANDRA TRAJANO N N 304.000000 0000 00 N 0 
5 016 F S 028 0  Y 31 25 00 O 0012 Y Y Y Y 0012 024 0.000000 Y N 0 MARCIA CRISTINA ZANELLA SANDRO L P MARTINS N N 250.000000 0000 00 N 0 

..... 

49998 023 F S 023 0  Y 31 28 00 P 0264 Y Y Y Y 0012 991 0.000000 Y N 0 NOVINA GLAUCIA N N 240.000000 0000 00 N 1 
49999 009 F C 038 0  Y 5 28 00 P 0048 Y Y Y Y 0204 040 0.000000 Y N 0 LILIANE FIGUEIREDO MIRNA CARVALHO NASCIMENTO N N 616.000000 0000 00 N 0 
50000 022 M S 029 0  Y 31 23 00 P 0048 Y Y N Y 0036 026 0.000000 Y N 0 TITO MARTINS  N N 341.000000 0000 00 N 0 
+5

這不是這個網站的工作原理。我們不做工作要求或要求。您需要付出一些努力來解決一個真正的問題:嘗試一些具體的東西,向我們展示您的代碼,給我們一個可重複的例子。 – joran

+0

請參閱我試過的代碼。對不起,我的工作,因此要求.. –

+3

「[此代碼]不起作用」沒有幫助。你試過的代碼的輸出是什麼,你期望它是什麼? –

回答

4

你得到的錯誤無關,與缺失值(這可能會或可能不會提出自己的問題)。它可以很容易地通過做被複制:

sum(1:100000) 
#[1] NA 
#Warning message: 
#In sum(1:1e+05) : integer overflow - use sum(as.numeric(.)) 

,也可以通過轉換爲雙打避免:

sum(as.numeric(1:100000)) 
#[1] 5000050000 

所以做

d$V5 = as.numeric(d$V5) 

,並從那裏。

+0

感謝eddi,它是完美的。 你知道如何使用r查找信息增益嗎?你能否告訴我,如果你有任何關於它的想法。 –

+0

我不知道如何定義「信息增益」...?我不太瞭解你感興趣的話題,你可能想發佈一個關於這個問題的單獨問題(並且我會包含一個定義或對該數量定義的引用)。 – eddi

+0

謝謝eddi。 我寫了一個問題,我還沒有得到任何迴應。谷歌說使用FSelector包。 當我嘗試使用它時,顯示一條消息說 庫(FSelector)中的錯誤:沒有名爲'FSelector'的軟件包 我不知道替代軟件包的工作方式。 –