0
我有一個包含文本文檔的數據集。訓練數據集將一些文檔分類爲垃圾郵件/火腿。我需要使用一個模型,以便每個測試文檔的值在0-1之間(0代表垃圾郵件,1代表火腿)。我使用了樸素貝葉斯分類器,它給出了屬於火腿或垃圾郵件的每個測試實例的概率。但是SVM迴歸(weka中的SMOreg)總是灰顯。我嘗試將課程標籤更改爲0和1(0 =垃圾郵件,1 =火腿),仍然沒有運氣。誰能幫忙?爲什麼SVM迴歸(SMOreg)在weka中灰顯?
我有一個包含文本文檔的數據集。訓練數據集將一些文檔分類爲垃圾郵件/火腿。我需要使用一個模型,以便每個測試文檔的值在0-1之間(0代表垃圾郵件,1代表火腿)。我使用了樸素貝葉斯分類器,它給出了屬於火腿或垃圾郵件的每個測試實例的概率。但是SVM迴歸(weka中的SMOreg)總是灰顯。我嘗試將課程標籤更改爲0和1(0 =垃圾郵件,1 =火腿),仍然沒有運氣。誰能幫忙?爲什麼SVM迴歸(SMOreg)在weka中灰顯?
SMOreg是迴歸方法,而你的問題是分類。 WEKA automaticaly「灰色化」不可靠的方法(這些方法不受庫支持和/或不可用於您的數據)。
你能告訴我如何得到每個測試實例屬於任何一類使用SVM分類器的概率? (對不起,如果這是一個noob問題,我是weka的新手) – user3477953
SVM不會返回上課的概率。有這樣的「技巧」 - 比如Platt的縮放(例如在libSVM中實現)。 – lejlot
實際上,在weka中使用SMO分類器時,我在「更多選項」中檢查了「輸出預測」,weka給出了分類器輸出中每個測試實例的概率分佈。我認爲那些是我需要的價值,或者他們代表了別的東西? – user3477953