我已經建立了一個使用weka的分類模型。我有兩個類,即{垃圾郵件,非垃圾郵件}在應用stringtowordvector過濾器後,我獲得了19000條記錄的10000個屬性。然後我使用liblinear庫來構建模型,它給了我F-得分如下: 垃圾郵件94% 非垃圾郵件的98%爲什麼Weka中的分類模型將所有實例預測爲一個類?
當我使用相同的模型來預測新的情況下,預測它們作爲垃圾郵件。 另外,當我嘗試使用與訓練集相同的測試集時,它也將它們全部預測爲垃圾郵件。我精神疲憊地發現問題。任何幫助將不勝感激。
我發現了這個問題。在測試實例時,我沒有將字符串應用於單詞向量過濾器。 – user2335004