2017-09-05 29 views
-1

在Weka資源管理器中,有一個Generate ...按鈕用於生成數據,其中列出了幾個數據生成器。Weka的文檔生成...按鈕

我可以用默認設置運行數據生成器,但不太明白我在看什麼。

例如,如果我使用RDG1生成數據,並使用熟悉的pima糖尿病數據集的關係,它使用一組生成數據的規則。我可以輕鬆保存生成的數據。但是,生成的規則在哪裏?

而且從代我的輸出文件看起來像這樣:

@data 
true,false,false,false,true,false,true,true,true,true,c0 
true,true,false,false,false,true,true,false,true,true,c0 
false,false,true,true,false,true,false,false,false,false,c1 
false,true,false,true,true,false,true,true,false,false,c0 
true,true,false,false,false,true,true,false,false,true,c0 
true,true,true,true,false,false,true,false,true,true,c1 
true,true,false,true,true,false,true,false,false,true,c0 
false,false,true,false,true,true,false,true,false,true,c1 
true,true,false,true,false,true,false,true,true,true,c0 
(etc) 

不符合原始數據的格式(或屬性在原始數據的數量),這是

@data 
6,148,72,35,202.2110173,33.6,0.627,50,pos 
1,85,66,29,67.77822497,26.6,0.351,31,neg 
8,183,64,21.74211976,236.7083422,23.3,0.672,32,pos 
1,89,66,23,94,28.1,0.167,21,neg 
0,137,40,35,168,43.1,2.288,33,pos 
5,116,74,23.22841651,118.637693,25.6,0.201,30,neg 
3,78,50,32,88,31,0.248,26,pos  
(etc) 

所以,我真的不知道我在這裏看着什麼與生成的數據。

回答

1

您可以通過點擊在DataGenerator窗口中的命令文本,然後單擊More找到每個發電機簡要文件:

DataGenerator window

Data generator documentation window

在某些情況下,這種文件將包括一個參考進一步的信息。

還有如何在this video更多數據挖掘使用一個數據發生器用WEKA在線課程的例子,但一旦你閱讀文檔的最佳教程可能只是產生一些數據集的每一個並檢查結果。