1
我使用Python中SciKit庫中的LinearSVM對文本數據進行分類,並且它完美地工作。 我的問題是,有沒有辦法找到我的分類模型的支持向量? 我認爲我的數據支持向量將是一個單詞列表!如何從Python中的SVM分類器提取支持向量?
我需要這個,因爲我想爲不同的文本數據找到分類器的顯着特徵。 (如何區分不同的文本數據)
在此先感謝。
我使用Python中SciKit庫中的LinearSVM對文本數據進行分類,並且它完美地工作。 我的問題是,有沒有辦法找到我的分類模型的支持向量? 我認爲我的數據支持向量將是一個單詞列表!如何從Python中的SVM分類器提取支持向量?
我需要這個,因爲我想爲不同的文本數據找到分類器的顯着特徵。 (如何區分不同的文本數據)
在此先感謝。
對於SVM情況scikit學習,你應該能夠訪問下列方式支持向量:
>>> # get support vectors
>>> clf.support_vectors_
array([[ 0., 0.],
[ 1., 1.]])
>>> # get indices of support vectors
>>> clf.support_
array([0, 1]...)
>>> # get number of support vectors for each class
>>> clf.n_support_
array([1, 1]...)
我不明白你想要什麼用支持向量來做。你能否重新說明你的問題? – filannim
@filannim感謝您的評論,讓我們這樣說吧:我有三個分類器:樸素貝葉斯,SVM和線性迴歸。我使用火車集訓練他們。現在,我想查找每個分類器被認爲很重要的前10個詞彙表(及其相應的權重)。 – Pymal
如果你想選擇你正在使用的特徵中最具辨別性的特徵,那麼你可以使用RELIEF(http://en.wikipedia.org/wiki/Relief_(feature_selection))。查看「特徵選擇算法」以獲得總體概述。 – filannim