2013-02-05 49 views
-1

例如,如果我們得到一個訓練集有超過10000個數據點(訓練集的大小)和沒有超過100000的特徵和大約20附近的類標籤。所以在這種情況下,哪個分類器(方法如決策樹,SVM,樸素貝葉斯,神經網絡,提升)會給我最準確的分類測試數據的類標籤。什麼是最好的分類器

+2

你需要**試戴數據**。沒有一般規則。 –

+0

第一步是定義*最佳* – YXD

回答

4

正如評論中指出的,沒有一般的規則。

由於您有相當多的訓練實例和大量的特徵,但您可能需要某種鼓勵特徵稀疏性的分類器。我會先嚐試一個帶有L1或彈性淨懲罰的SGD線性分類器。

Andreas Mueller's flow chart of algorithms to try參見:

相關問題