2017-04-18 46 views
0

我在klaR軟件包中使用NaiveBayes函數,出於某種原因,該函數不會將公式輸入參數讀取。我知道NaiveBayes函數有兩種方法,一種是「默認」,另一種是「公式」的輸入類。當我運行NaiveBayes函數時,它會將我的輸入公式讀取爲默認類型,並引發錯誤。我的代碼如下:R NaiveBayes分類器不會將類型讀爲「公式」

trainData <- read.csv("train.txt") 
trainNB <- NaiveBayes(Type~., data = trainData) 

我運行這些行之後收到的錯誤是:

Error in NaiveBayes.default(X, Y, ...) : 
    grouping/classes object must be a factor 

trainData的類是數據幀,並且第一10行trainData的是如下(I有共83排):

Area Perimeter Compactness Length Width Asymmetry Groove Type 
1 14.80  14.52  0.8823 5.656 3.288 3.1120 5.309 1 
2 14.79  14.52  0.8819 5.545 3.291 2.7040 5.111 1 
3 14.99  14.56  0.8883 5.570 3.377 2.9580 5.175 1 
4 19.14  16.61  0.8722 6.259 3.737 6.6820 6.053 0 
5 15.69  14.75  0.9058 5.527 3.514 1.5990 5.046 1 
6 14.11  14.26  0.8722 5.520 3.168 2.6880 5.219 1 
7 13.16  13.55  0.9009 5.138 3.201 2.4610 4.783 1 
8 16.16  15.33  0.8644 5.845 3.395 4.2660 5.795 0 
9 15.01  14.76  0.8657 5.789 3.245 1.7910 5.001 1 
10 14.11  14.10  0.8911 5.420 3.302 2.7000 5.000 1 

任何幫助將不勝感激。謝謝!

回答

0

我覺得你的因變量是不是一個因素:

你應該這樣做,trainData$Type <- as.factor(trainData$Type)

試想,這種玩具的例子:如果你想看到的結構

library(e1071) 
m <- naiveBayes(Species ~ ., data = iris) 

,你會注意物種在因子中,物種在這裏是你的因變量:

> str(iris) 
'data.frame': 150 obs. of 5 variables: 
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... 
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... 
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... 
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... 
$ Species  : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ... 
> 
+1

謝謝你!這實際上有效!在我的情況下,我的因變量存儲在我的trainData變量的最後(第8)列。我做了'trainData [,8] < - factor(trainData [,8])'並運行完全一樣的'trainNB'線,它運作良好! –

相關問題