2015-05-04 16 views
0

我在scikit-learn網站上看到,當維數大於樣本數時,SVM是一個不錯的選擇。分類 - 當維數大於樣本數時,我們可以使用什麼?

我想知道你認爲(有經驗的用戶)在預測類是二元的情況下效率更高。

,特別是做什麼的時候標記的樣本數量大約爲50

算法,應該工作?需要關心的事情?

+0

當樣本數量很少時,我懷疑你可以從中學到任何東西。 –

+0

是的,這就是我的想法,當樣本數量很小時可以做些什麼?也許每次知道新樣本時會更準確些? – DavidK

+0

維度是什麼?如果你對線性模型沒有問題,那麼像l1這樣的稀疏線性模型會懲罰SVM。 –

回答

0

如果您有密集的數據,並且您有過度擬合的高風險:每個維度或維度差異都可以唯一標識您的培訓記錄。

這並不意味着它不起作用,只是在評估您的方法時必須格外小心,因爲過度擬合的風險很高。

一次僅使用一個維度的方法 - 如決策樹 - 可能受到的影響較小。特別是,如果你將修剪技術應用到你的樹上。

+0

它是1.4102這樣的數值數據。如果每個功能都具有唯一值,該怎麼辦? – DavidK

相關問題