2013-04-18 135 views
3

我正在處理一個分類問題,我只有一個類的數據,所以我想在「目標」類與其他所有可能性「離羣」類之間進行分類。因此,我打算使用單類分類器或LibSVM分類器。但問題在於:一類分類器培訓

我需要提供「異常值」類的培訓數據嗎?如果是的話,有什麼方法可以解決這個問題,因爲我只有關於Target類的數據。

回答

4

實現此目的的一種方法是僅從正類獲取樣本density estimation。您可以爲數據擬合參數模型(例如,多變量法線)或使用核密度估計器(有點像最近鄰居的單類版本,具有核化距離度量標準)。然後,在學習模型下評估新數據的可能性,如果它足夠低,則拒絕它作爲班級的成員。

+0

我們如何評估核密度估計器本身?就像什麼內核好,要設置什麼帶寬一樣。 (我們確實有計算帶寬的功能,但是我們知道它們是否最適合?) – Uno

1

您可以使用 一類SVM的新穎性檢測,你只需要訓練它的目標類,它將你的數據進行分類是由訓練有素的類相似或不同
您可以閱讀scikit文檔,一類支持向量機here