0

考慮到我可能有被寫成如下形式的ARFF文件:測試用例的Weka

@relation spamOrNot 
@attribute body String 
@attribute result {spam, notspam} 
"free money now!", spam 
"hi meet me at 10", notspam 

和我跑這個訓練樸素貝葉斯分類器上的Weka。我如何創建一個測試集,以便這個訓練好的分類器能夠做出預測?謝謝。

+0

下載您自己的收件箱和垃圾郵件的副本,編寫腳本將郵件轉換爲垃圾郵件,並檢查您是否得到與您的電子郵件提供商所做的相同的預測。 – 2012-03-13 22:42:42

回答

1

有許多數據存儲庫,您可以在其中找到垃圾郵件和非垃圾郵件示例(來自現實生活)。然後,拿出垃圾郵件/非垃圾郵件的正文,並使用適當的標籤(垃圾郵件用於垃圾郵件正文,不用垃圾郵件)發佈類似這樣的arff文件(但這次它將測試arff文件) )。通過你的訓練變量文件,你將得到一個分類器模型。保存該模型。然後在Weka資源管理器分類選項卡上,選擇單選按鈕「測試集」並選擇您的測試集(它將具有標籤)。然後加載你的訓練模型,右鍵點擊它,然後選擇用測試集重新評估。你完成了。