2015-04-24 79 views
0

我的數據集中有11個類/類別。對於每個班級都有一些實例分配給它。我需要知道Weka提取的每個類別的屬性/單詞以及分配給每個屬性的數值。有沒有辦法做到這一點?如何從Weka獲得每個類的屬性

回答

0

這是Weka的訓練和分類ARFF文件格式的樣本:

在這種情況下,我在談論Semeval 2014爭奪西班牙使用的文件的一部分...

@relation Task10EnglishS2014 

@attribute PathLenAlign numeric 

@attribute ResAlign numeric 

@attribute LcAlign numeric 
@attribute WupAlign numeric 
@attribute Res numeric 
@attribute Lc numeric 
@attribute DiceSimilarityAttribute numeric 
@attribute NumericEvaluation numeric 
@data 
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,5.000 
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,5.000 
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,0.300 
... 

零碎:

@relation Task10EnglishS2014 

@relation +名稱的一組或實驗

@attribute LcAlign numeric 

@attribute +從這裏屬性

@data 

的屬性+類型的名稱,開始值的實例或向量爲每個輸入。

這是訓練集,它用於訓練分類新實例的模型。 在Weka資源管理器中,我們需要在預處理選項卡中加載此文件。在「分類」選項卡中,您需要選擇一個分類器並設置10個摺疊的交叉驗證,然後單擊「開始」按鈕。這將生成訓練有素的模型。

的ARFF分類文件必須具有以下結構:

@relation Task10EnglishS2014

@attribute PathLenAlign numeric 

@attribute ResAlign numeric 

@attribute LcAlign numeric 
@attribute WupAlign numeric 
@attribute Res numeric 
@attribute Lc numeric 
@attribute DiceSimilarityAttribute numeric 
@attribute NumericEvaluation numeric 
@data 
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,? 
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,? 
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,? 
... 

的?辛博爾意味着這是分類的價值。

他們必須選擇選項:「提供的測試集」並選擇文件進行分類,然後在「模式選項...」中選擇「輸出預測」,並在模型中右鍵單擊並選擇「重新評估模型在當前測試集上「。 在右側面板中顯示結果。

+0

謝謝你的努力和解釋。但是,我已經完成了培訓步驟,並且我意識到分類步驟。我的問題是找到一種方法來知道我的數據集中的哪些屬性被weka分配給哪個類(訓練之後) –