2012-10-11 55 views
1

衆所周知,的特徵構成特徵向量,需要更多數量的樣本來訓練分類器。在我的情況下,我在一個兩級問題中使用一個反向傳播多層感知器,其中大約有256個特徵組成一個特徵向量。樣本大小和特徵向量維度之間的經驗法則是什麼?

現在我的樣本量不是無限的。約2000個正面和2000個負面樣本。

在制定一些降維程序和所有這些之前,我想知道是否有任何這樣的關係。樣品和沒有。特徵向量中的維數。

回答

2

這兩者之間沒有實際的直接關係,因爲必要數量的訓練數據也取決於模型的複雜性和所用的訓練程序。

從實際的角度來看,我會建議先運行一個簡單的區別性分類器,看看它如何與所有的功能一起工作,然後可能應用某種特徵選擇。

+0

soufanom,這不是關於求解方程組,真的。此外,即使特徵的數量顯着超過訓練樣本的數量,有時也可能找到一個好的分類器。 – Qnan

相關問題