2013-05-31 166 views
4

我有一組文件,每個文件都包含一個唯一的標識符。我用編程方式使用Weka,並創建一個訓練變量文件。 arff文件中的每個實例都對應於我從每個文件中提取的一組屬性,因此每個文件一個實例。如何將每個文件的標識符與arff文件中的相應實例鏈接起來。非常感謝你提前。Weka中的ID屬性

+0

我不完全明白的問題 - 你嘗試只需添加一個新功能,擁有標識? – kutschkem

+0

爲了更加清晰,您可以添加代碼片段嗎? – Chris

回答

4

您可以通過創建額外的屬性as described here將標識符與每個實例相關聯。

因此,你的情況,你會創建一個字符串屬性,並將此屬性添加到每個實例。在訓練和測試分類器時,您需要刪除標識符,該標識符可以使用Remove Type Filter(默認情況下會刪除字符串類型)輕鬆完成;刪除過濾器也可以在指定屬性索引的地方起作用。

如果您使用命令行運行Weka,則可以使用-p選項來輸出預測和屬性(即使是對已過濾的屬性)。請參閱第一個鏈接的底部。

1

如果我沒有誤解,你想鏈接2個或更多的arff文件在一起。

我們假設我們有兩個名爲​​3210和file2.aff的arff文件。

您可以通過在命令行中使用下面的代碼:

java weka.core.Instances append file1.arff file2.arff 

乾杯