Q

分類 - 當維數大於樣本數時，我們可以使用什麼？

2015-05-04 16 views 0 likes

0

我在scikit-learn網站上看到，當維數大於樣本數時，SVM是一個不錯的選擇。分類 - 當維數大於樣本數時，我們可以使用什麼？

我想知道你認爲（有經驗的用戶）在預測類是二元的情況下效率更高。

，特別是做什麼的時候標記的樣本數量大約爲50

算法，應該工作？需要關心的事情？

2015-05-04 DavidK

+0

當樣本數量很少時，我懷疑你可以從中學到任何東西。 –

+0

是的，這就是我的想法，當樣本數量很小時可以做些什麼？也許每次知道新樣本時會更準確些？ – DavidK

+0

維度是什麼？如果你對線性模型沒有問題，那麼像l1這樣的稀疏線性模型會懲罰SVM。 –

A

回答

0

如果您有密集的數據，並且您有過度擬合的高風險：每個維度或維度差異都可以唯一標識您的培訓記錄。

這並不意味着它不起作用，只是在評估您的方法時必須格外小心，因爲過度擬合的風險很高。

一次僅使用一個維度的方法 - 如決策樹 - 可能受到的影響較小。特別是，如果你將修剪技術應用到你的樹上。

2015-05-04 15:13:44

+0

它是1.4102這樣的數值數據。如果每個功能都具有唯一值，該怎麼辦？ – DavidK

相關問題