2015-06-06 29 views
0

我想用n元分類文本中的不同概念。我的數據tyically存在六列的:在進行n-gram分類時,Rapidminer中的多項式錯誤

  1. 需要分類
  2. 分類
  3. 第一個字上的1左)
  4. 第二個字上1左邊的字)
  5. 第一字1)
  6. 第二個字的第02期1權)

當我嘗試在Rapidminer中使用SVM,我得到它無法處理多項式值的錯誤。我知道這是可以做到的,因爲我已經在不同的論文中閱讀過。我將第二列設置爲'label',並嘗試將其餘部分設置爲'text'或'real',但它似乎沒有效果。我究竟做錯了什麼?

回答

0

一種方法可以是創建名稱等於距離感興趣單詞的距離的單詞和值的屬性。當然,所有可能的單詞都需要表示爲屬性,因此輸入數據會很大。

相關問題