2014-10-30 69 views
0

我已經成功地將LibSVM API集成到mu java代碼中。我需要將大型文檔集合轉換爲數字表示並將其提供給LibSVM分類器。據我所知weka有能力將文檔轉換爲特徵向量。任何人都可以告訴我該怎麼做?如何在java代碼中結合weka和LibSVM

回答

1

U可以做這樣的

DataSource source = new DataSource(new File("mycsvinputfile")); 
    System.out.println(source.getStructure()); 
    Instances data = source.getDataSet(); 

    // setting class attribute if the data format does not provide this information 
    // For example, the XRFF format saves the class attribute information as well 
    if (data.classIndex() == -1) 
     data.setClassIndex(data.numAttributes() - 1); 

    //initialize svm classifier 
    LibSVM svm = new LibSVM(); 
    svm.buildClassifier(data); 

不要忘了在你的項目中使用weka.jar,libsvm.jar和wlsvm.jar(在LIBSVM包裝)。因此,只需在您的構建路徑或課程路徑中包含所有3個罐子或任何其他罐子。

+0

我們真的需要wlvsm嗎?如果是的話我可以找到它嗎? – 2014-10-30 17:33:18

+1

它是libsvm的包裝器。所以你幾乎需要它。最好 – 2014-10-31 09:44:23

+0

感謝您的更新迴應 – 2014-11-01 04:15:35