2014-04-15 132 views
1

我使用Python中SciKit庫中的LinearSVM對文本數據進行分類,並且它完美地工作。 我的問題是,有沒有辦法找到我的分類模型的支持向量? 我認爲我的數據支持向量將是一個單詞列表!如何從Python中的SVM分類器提取支持向量?

我需要這個,因爲我想爲不同的文本數據找到分類器的顯着特徵。 (如何區分不同的文本數據)

在此先感謝。

+0

我不明白你想要什麼用支持向量來做。你能否重新說明你的問題? – filannim

+0

@filannim感謝您的評論,讓我們這樣說吧:我有三個分類器:樸素貝葉斯,SVM和線性迴歸。我使用火車集訓練他們。現在,我想查找每個分類器被認爲很重要的前10個詞彙表(及其相應的權重)。 – Pymal

+0

如果你想選擇你正在使用的特徵中最具辨別性的特徵,那麼你可以使用RELIEF(http://en.wikipedia.org/wiki/Relief_(feature_selection))。查看「特徵選擇算法」以獲得總體概述。 – filannim

回答

1

對於SVM情況scikit學習,你應該能夠訪問下列方式支持向量:

>>> # get support vectors 
>>> clf.support_vectors_ 
array([[ 0., 0.], 
     [ 1., 1.]]) 
>>> # get indices of support vectors 
>>> clf.support_ 
array([0, 1]...) 
>>> # get number of support vectors for each class 
>>> clf.n_support_ 
array([1, 1]...) 

[來源:http://scikit-learn.org/stable/modules/svm.html]

相關問題