2014-12-27 152 views
0

我正在使用Weka作爲我的項目。 我有兩個數據集: 「?」Weka測試集顯示0個實例

  1. train.arff - - > 20個屬性和1類
  2. test.arff> 20個屬性和類被標記爲

我訓練了模型的百分比拆分,並將模型保存到NaiveBayes.model。然後加載模型,選擇Supplied測試集,檢查Output Predictions並根據當前測試集重新評估模型。

結果表明:

=== Predictions on test set === 

inst#, actual, predicted, error, probability distribution 

=== Summary === 

Total Number of Instances    0  

=== Detailed Accuracy By Class === 

       TP Rate FP Rate Precision Recall F-Measure ROC Area Class 
       0   0   0   0   0   ?  6.0 
       0   0   0   0   0   ?  5.0 
       0   0   0   0   0   ?  7.0 
       0   0   0   0   0   ?  4.0 
       0   0   0   0   0   ?  2.0 
       0   0   0   0   0   ?  1.0 
       0   0   0   0   0   ?  3.0 
       0   0   0   0   0   ?  NA 
Weighted Avg. NaN  NaN  NaN  NaN  NaN  NaN  

但實際上,我有2000條記錄test.arff。

任何人都可以幫忙嗎?謝謝!

+1

如果您使用的是GUI,在分類標籤我會選擇「更多選項」,並啓用「輸出的預測」。如果它實際上預測測試實例,這可能會給你一些洞察。我懷疑它是,但不報告結果,因爲它不知道它的預測是否正確(因爲有問號) – Walter

+0

[Weka忽略未標記的數據]的可能重複(http://stackoverflow.com/questions/ 16432121/WEKA-忽略-未標記數據) – Sentry

回答

0

就像沃爾特已經指出的,Weka需要知道實際的課程,告訴你它有多好。如果您想重新評估模型,則測試集中的類別標籤不得將設置爲未知

看到這個問題和答案,它應該幫助你。如果沒有,告訴我們爲什麼,我們試圖找出答案。

Weka ignoring unlabeled data