1
我正在通過svm.tune使用網格搜索方法來獲取我的svm的最佳gamma和C參數。數據集有7M行和11個特徵變量。R - 改進e1071調整性能
看來,調整我的數據5M行花費很長時間,或將耗盡內存(當我減少網格搜索的範圍)。
有沒有人有任何關於如何提高性能的建議?縮放功能?或者也許減少訓練的行數?
我正在通過svm.tune使用網格搜索方法來獲取我的svm的最佳gamma和C參數。數據集有7M行和11個特徵變量。R - 改進e1071調整性能
看來,調整我的數據5M行花費很長時間,或將耗盡內存(當我減少網格搜索的範圍)。
有沒有人有任何關於如何提高性能的建議?縮放功能?或者也許減少訓練的行數?
對隨機的數據子集進行網格搜索,然後使用最佳參數在整個數據集上訓練您的svm。適合svm既是處理器又是內存飢餓。
事實上,svm的訓練時間不會根據數據的大小線性縮放,請參閱本文以獲取此問題的可能解決方案: http://www.datasciencecentral.com/配置文件/博客/機器學習平行支持向量機 – latorrefabian
你介意添加調整函數或參數使用? –