2014-02-25 60 views
0

我在我的數據集上嘗試使用Weka的不同分類器。我有小數據集,我將數據分爲五類。 我的問題是,當我通過不同的分類器應用交叉驗證或百分比分類分類時,我得到了非常不同的結果。weka中的SMO,NaiveBayes和BayesNet分類器的不同結果

例如,當我使用NaiveBayseBayseNet分類,我有大約40的所有類的F-得分,但使用SMO我得到的是獲得20的F-分數的壞的結果,當我使用LibLinear分類這給了我大約15分的F分數。

也許我應該提到,因爲LibLinear分類器不接受名詞,所以我給每個可能的名義值分配一個代碼,並將它們用作我的數據集中的Numeric值。

有人可以告訴我爲什麼我會得到這樣不同的結果嗎?我預計所有分類器都會有大致相似的結果。

此外,當我在我的測試集上使用LibLinear時,我將所有數據歸入其中一個類中,而其他四個類中沒有實例。

由於提前,

回答

0

你爲什麼會想到類似的結果?對於小數據集,我認爲不同的方法可能很容易導致不同的預測。線性模型也有容忍閾值,會導致收斂前提前終止。例如,您可以在LibLINEAR或SMO中玩這個遊戲。