我對機器學習非常陌生。對不起,如果我的英語有任何錯誤。機器學習在weka中的分類和預測
我正在使用weka J48分類來預測真或假。我有幾乎999K的訓練集,我用它訓練模型。我用3倍的交叉驗證方法來訓練模型,使我的準確性達到84%。
現在存儲模型後。我試圖在50k數據集上進行測試。這是非常糟糕的結果,其中50%不匹配。我有名義和數字字段的11個屬性。
我不知道爲什麼會發生。
我有兩個問題。
- 我該如何訓練以在測試集上執行得更好。
- 什麼可能是可能的問題。
我在java中使用weka api。
你是如何選擇50K套裝進行測試的? –
其實,我使用30天的訓練數據和1天的數據進行測試和預測。 – Maxi
你如何獲得1天的測試數據? –