我試圖讓Weka從命令行預測,但我擔心我可能會做這個錯誤。我閱讀了數據挖掘書,並在他們的網站上搜索了文檔,但是我發現最多是模糊的,所以我希望你能幫助我。告訴Weka在ARFF文件中預測哪些屬性?
首先,我創建了一個訓練集(train.arff)。這裏有一個例子:
@relation test
@attribute 'A' {0,1}
@attribute 'B' {0,1}
@attribute 'C' {0,1}
@attribute 'D' {0,1}
@attribute 'E' {0,1}
@attribute 'F' {0,1}
@data
0,0,0,0,0,0
0,0,0,0,0,0
...
然後,我創建的數據設置爲預測(test.arff)完成: 「?」
@relation test
@attribute 'A' {0,1}
@attribute 'B' {0,1}
@attribute 'C' {0,1}
@attribute 'D' {0,1}
@attribute 'E' {0,1}
@attribute 'F' {0,1}
@data
0,?,0,0,0,0
0,?,0,0,0,0
...
的標誌着應該預測的屬性。
最後,我試圖通過在命令行中運行該工具來獲取預測:
java weka.classifiers.trees.J48 -t train.arff -T test.arff -p 0
它產生以下輸出:
=== Predictions on test data ===
inst# actual predicted error prediction
1 2:1 2:1 0.939
2 2:1 2:1 0.939
然後我拿了號後的「:」在由inst#標記的數據行的預測列中。
這裏是我的問題:
這是正確的嗎?我很擔心「?」因爲我讀到它可能是估算的(儘管這可能只是在學習階段)。
Weka是否支持多重預測?無論有多少個字段都標有「?」我總是得到每個實例只有一個預測值的同一個表。
Can Weka可以生成一個完整的(預測的)ARFF文件,還是我必須從結果中自行構建?
如果我錯過了顯而易見的事情,請事先道歉並指出相關文檔的任何指標將不勝感激。
在此先感謝!
非常感謝!因此,使用train.arff來預測test.arff的'F',我可以這樣做:「java weka.classifiers.trees.J48 -c'F'-t train.arff -T test.arff -p 0」,對吧?我知道關於保存模型,但我只是想先弄清楚基礎知識。 –
我想我已經在那裏(1下)了。 –