1
我有大約111 Mb的大特徵數據集,用於217000數據點的分類,每個點有1760000個特徵點。當在MATLAB中使用SVM進行訓練時,需要很長時間。如何在MATLAB中訓練大數據集以進行分類
如何在MATLAB中處理這些數據。
我有大約111 Mb的大特徵數據集,用於217000數據點的分類,每個點有1760000個特徵點。當在MATLAB中使用SVM進行訓練時,需要很長時間。如何在MATLAB中訓練大數據集以進行分類
如何在MATLAB中處理這些數據。
這取決於您正在構建什麼類型的SVM。
作爲一個經驗法則,用這麼大的功能集,你需要看看線性分類,如沒有一個SVM /線性內核,或與各種正則化等
如果你迴歸訓練具有高斯內核的SVM,該訓練算法具有O(max(n,d) min (n,d)^2)複雜度,其中n是示例數量和d特徵的數量。在你的情況下,它最終是O(dn^2)這是相當大的。使用線性內核的
也沒有解決速度問題。但它至少給出了結果,但仍然不能接受速度。 – abhi
那麼它給了你一些結果,所以它比另一種方法好一點。具有將近200萬個功能,您(1)不能期望它快速並且(2)不能使用二次方。但是,對於您提供的少量細節,我們無法真正幫助您。 「很多時間」是什麼意思?您正在使用的SVM的配置是什麼? –