2013-11-23 89 views
0

給定數據集誤分類二元SVM

0 0 1 
3 4 1 
5 9 1 
12 1 1 
8 7 1 
9 8 -1 
6 12 -1 
10 8 -1 
8 5 -1 
14 8 -1 

當這些列車數據應用SVM,

3 4 1,8 7 1 and 6 12 -1 are missclassified. 

這是什麼mean--

數據點3 4無論是在亙古不變的秋天類標籤1,但落入-1。

是這樣嗎?

回答

1

是的,這意味着該模型已校準的產率:

3 4 => -1

8 7 => -1

6 12 => 1

你有30%的錯誤率。

使用線性判別分析方法,您可以有20%的錯誤率。 但請記住,你的人口中沒有太多元素(只有10)。對於2個描述符而言這是相對較低的。

事實上,如果你估計與引導方法的錯誤率,我們發現:

  • 用於判別分析方法的一個60%的錯誤率

  • 的SVM方法的一個55%的錯誤率:SVM往往更適合過度擬合。

乾杯

+0

感謝您的回覆大衛。 –