我是R中的統計和數據分析的新手 今天我在R中嘗試樸素貝葉斯算法 我面臨的問題是我無法理解預測。 該代碼後面是這樣的:R的樸素貝葉斯算法的輸出說明
install.packages('ElemStatLearn')
library('ElemStatLearn')
library("klaR") library("caret")
sub = sample(nrow(spam), floor(nrow(spam) * 0.9))
train = spam[sub,]
test = spam[-sub,]
xTrain = train[,-58]
yTrain = train$spam
xTest = test[,-58]
yTest = test$spam
model = train(xTrain,yTrain,'nb',trControl=trainControl(method='cv',number=10))
prop.table(table(predict(model$finalModel,xTest)$class,yTest))`
結果顯示這裏是如下:
yTest
email spam
email 0.33405640 0.02603037
spam 0.24945770 0.39045553
可以參考此鏈接查看http://joshwalters.com/2012/11/27/naive-bayes-classification-in-r.html
好吧,明白了,樸素貝葉斯模型輸出存儲在模型數據框中。但那麼kappa的含義和準確性是什麼。 @Shahar Bental – Tappy
你可以分享kappa的代碼和輸出以及準確性嗎? 精度被很好地定義, https://en.wikipedia.org/wiki/Accuracy_and_precision Cohen的κ是「歸一化」的精度的一種形式: https://en.wikipedia.org/wiki/Cohen's_kappa –
上面寫的是我的代碼,而樸素貝葉斯 4140個樣本 57預測 2類:「郵件」,「垃圾郵件」 沒有預先處理 重採樣:交叉驗證(10倍) 摘要樣本量:3726 3726,3727,3727,3725,3725,... 跨調諧參數的重採樣結果: usekernel準確度Kappa FALSE 0.7126367 0.4581488 TRUE 0.5599037 0.2290060 – Tappy