我需要在weka中使用SVM來過濾使用Java的文檔

您可以按照本教程的如何在WEKA使用SVM：www.stat.nctu.edu.tw/~misg/WekaInC現在，你將需要ARFF格式的數據（並且我建議你使用這個數據，因爲我的exp，它有幫助，數據看起來比WEKA的預期更加結構化）。所以，你可以使用我爲自己寫的XML2ARFF-Converter。您可以修改它以讀取文本文件並將您的文本文件轉換爲ARFF。

2011-02-22 21:42:41 zengr

你能對出詳細說明內存異常？我正在調查weka是否適合我，這些問題有多糟？你看過增加堆嗎？ http://weka.wikispaces.com/OutOfMemoryException – Blub 2011-05-06 15:11:50

我沒有多少探索。但weka是一個廣泛使用的庫，我相信你會得到一些聰明的解決方法。我沒有使用它，因爲我有理由使用我正在嘗試學習的Ruby。 – zengr 2011-05-06 15:45:19

如果您使用的是大型數據集，那麼通常會遇到內存限制 - 如果您使用weka命中這些數據庫，請嘗試使用-Xmx標誌增加JVM堆大小：「java -Xmx8000m -jar weka.jar」將運行一個8000mbs的堆分配weka。 – 2014-05-07 13:18:28

回答