0
我的數據集中有11個類/類別。對於每個班級都有一些實例分配給它。我需要知道Weka提取的每個類別的屬性/單詞以及分配給每個屬性的數值。有沒有辦法做到這一點?如何從Weka獲得每個類的屬性
我的數據集中有11個類/類別。對於每個班級都有一些實例分配給它。我需要知道Weka提取的每個類別的屬性/單詞以及分配給每個屬性的數值。有沒有辦法做到這一點?如何從Weka獲得每個類的屬性
這是Weka的訓練和分類ARFF文件格式的樣本:
在這種情況下,我在談論Semeval 2014爭奪西班牙使用的文件的一部分...
@relation Task10EnglishS2014
@attribute PathLenAlign numeric
@attribute ResAlign numeric
@attribute LcAlign numeric
@attribute WupAlign numeric
@attribute Res numeric
@attribute Lc numeric
@attribute DiceSimilarityAttribute numeric
@attribute NumericEvaluation numeric
@data
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,5.000
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,5.000
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,0.300
...
零碎:
@relation Task10EnglishS2014
@relation +名稱的一組或實驗
@attribute LcAlign numeric
@attribute +從這裏屬性
@data
的屬性+類型的名稱,開始值的實例或向量爲每個輸入。
這是訓練集,它用於訓練分類新實例的模型。 在Weka資源管理器中,我們需要在預處理選項卡中加載此文件。在「分類」選項卡中,您需要選擇一個分類器並設置10個摺疊的交叉驗證,然後單擊「開始」按鈕。這將生成訓練有素的模型。
的ARFF分類文件必須具有以下結構:
@relation Task10EnglishS2014
@attribute PathLenAlign numeric
@attribute ResAlign numeric
@attribute LcAlign numeric
@attribute WupAlign numeric
@attribute Res numeric
@attribute Lc numeric
@attribute DiceSimilarityAttribute numeric
@attribute NumericEvaluation numeric
@data
1,9.5852985,3.637587,1,8.0142254,3.637587,0.75,?
1,9.20881283333333,3.637587,1,8.3916004,3.637587,1,?
0.625,2.812914,2.754695,0.761905,2.812914,2.754695,0.5,0.292893218813452,?
...
的?辛博爾意味着這是分類的價值。
他們必須選擇選項:「提供的測試集」並選擇文件進行分類,然後在「模式選項...」中選擇「輸出預測」,並在模型中右鍵單擊並選擇「重新評估模型在當前測試集上「。 在右側面板中顯示結果。
謝謝你的努力和解釋。但是,我已經完成了培訓步驟,並且我意識到分類步驟。我的問題是找到一種方法來知道我的數據集中的哪些屬性被weka分配給哪個類(訓練之後) –