2015-12-06 61 views
-3

我是機器學習新手,目前正在處理分類問題。我能夠訓練模型並預測測試數據集。我想知道是否有某種方式可以與預測一起獲得分數。通過分數,我的意思是這些都是接近分數以及預測。例如,在標準的年齡 - 工資 - 購買(基於年齡和工資,客戶是否會購買該產品)分類問題中,我想知道100分中他將購買該產品的分數是多少預測他是否會購買它。如何獲得分數以及機器學習結果?

目前,我正在使用LibSVM Algo。有沒有提供以上數據的算法?

謝謝。

回答

0

你在找什麼是你的決定的支持。換言之,許多分類器根據他們x類的決策過在標籤上Y

cl(x) = arg max_{y \in Y} p(y|x) 

其中p(y|x)是它們的「X具有標記y」的內部估計。而這樣的分類包括:

  • 神經網絡(乙狀結腸輸出)
  • 迴歸
  • 樸素貝葉斯
  • 投票合奏(如RF)
  • ...

這些方法可以很容易地轉換爲您的0-100比例,因爲概率是0-1比例。另一方面,有些人使用與概率成比例的度量(如SVM),但是無界的,在這裏你可以得到這個值(通常稱爲決策函數),但是你不能將它轉換成0-100分(就像你做的那樣沒有「最大」值)。這是一個很大的缺點,所以提出了一些修改。特別是對於SVM,Platt的縮放比例實際上符合SVM頂部的邏輯迴歸,因此您可以獲得概率估計值。在libSVM您可以設置-b擺脫libsvm website

-b probability_estimates概率估計

:是否接受培訓,概率估計,0或1(默認爲0)

一個SVC或SVR模型