2014-09-24 21 views
1

在我的數據集中,實例的數量約爲200,每個實例的數量約爲600個屬性。每個實例都被標記(是,否),我試圖測試不同的分類器(k-NN,Naive-Bayes,j48)。用於分類的實例數量和屬性的關係

要生成更多的實例是非常困難的,相對於屬性數量的實例數是否有最小值?

我應該通過特徵選擇來減少屬性,但是如果我的屬性較少,這將是一個合理的數字?

回答

0

是否可以減少特徵的數量歸結到問題的複雜性,但一些試驗和錯誤(或自動特徵提取方法)可確定的特徵的數量可以不失精度降低。

正如在this post中所報道的那樣,可以使用一些指南或經驗法則來爲模型準備足夠的數據。一些建議包括在這裏:

  • 至少六次訓練案件的特點數
  • 至少三次,每次

希望的特徵數量這有助於!

+0

非常感謝! – user3437823 2014-10-01 06:19:46