2015-06-03 25 views
1

所以,我試圖對屬於兩個類中的一個的數據進行分類。這些類是相互排斥的,並且每個數據點都屬於一個或另一個。選擇帶有SVM的操作點和一般的分類模型

所以我嘗試了幾個分類器。在支持向量機的情況下,我得到了兩個輸出,屬於類別A的概率以及屬於類別B的概率。在這種類型的模型中,我認爲正常的行動方式是讓勝者承擔全部。

根據我的靈敏度/特異性要求,這在選擇操作點方面沒有太大的靈活性。考慮到這一點,我選擇使用P(B) - P(A)作爲我的分數。

直覺上,差異對我來說很有意義。如果模型100%確定我的數據點來自B類,並且100%確定它不是來自A類,那麼我得分爲1.在相反的情況下,我得到-1分。

但是,我不確定這是將分類模型轉換爲二元決策的最佳方式。它似乎工作,並超越我一直在訓練的神經網絡。所以我想我會問。思考?

回答

0

首先按操作點你是指設置一些閾值? 。

即使您身體狀況良好,這並不一定意味着它的好處。 P(B)-P(A)在你提到的情況下似乎很好。但是當P(A)= 0.7和P(3)= 0.4時呢? 。它清楚地表明該點屬於A類。通過減去它將被分類到錯誤的類別中。所以我的建議是使用直接分類結果。