2010-07-26 67 views
5

我想分類新聞數據集和訓練數據用IPTC主題代碼(分層分類)進行分類。 在我的項目中,我應該使用svm。支持向量機多類文本分類

我已經做了所有的特徵提取,詞幹,移除停止字...

我幾乎都需要SVM多文件格式:

這就好比:

category feature:value feature:value feature:value 

我不知道我應該怎麼使用svmmulticlass

我也聽說過關於one-all-all,我不知道它是什麼

請告訴我whrere我能找到一些關於它的教程,或者如何使用它

問候

回答

4

one-against-all,是一種訓練SVM在多標籤分類中的技術,例如你有「n」類標籤:所以你創建一個「n」SVM並訓練每一個類在+ Ve標籤和所有其他標籤。

這就是所有的意思。你可以訪問和使用那裏多級SVM

http://svmlight.joachims.org/svm_multiclass.html