2015-11-13 128 views
1

我對WEKAARFF文件還比較陌生,目前我正在使用它的GUI。我困惑的是我怎麼做我的預測(分類)與多個ARFF文件?WEKA預測多個ARFF文件

例如,文件A有3個屬性,"ID","attribute_1","attribute_2";而文件B有2個屬性,"ID","Scores"(用於預測的主屬性)。

問題是,file A中的每行數據都是唯一的,但B中的數據是重複的。這兩個文件都與它們的"ID"有關。換句話說,file Bfile A處爲每個元素存儲一組"scores"

有沒有關於如何將file A & B加在一起的建議?或者有什麼辦法可以解決WEKA的問題?

回答

1

Weka需要一張「拼合」表,即arff-文件。這個過程也被稱爲反規範化。有一個weka包(Denormalize),它包含一個過濾器來執行這個操作。

有一個例子,如何交易數據可以在這裏夷爲平地:https://weka.wikispaces.com/How+can+I+use+transactional+data+in+Weka%3F

使用過濾器,你將有你的兩個文件合併在一起之前。如果你有csv -files或類似的東西,你可以用Excel的手段實現這一目標,例如參見:

https://superuser.com/questions/420635/how-do-i-join-two-worksheets-in-excel-as-i-would-in-sql