2017-04-18 30 views
0

使用交叉驗證來確定最佳參數似乎非常標準。當然,這通常是一個耗時的過程。有沒有捷徑?還有其他更快的探索性分析形式可以提供哪些價值最佳的暗示?例如,在我目前對機器學習和SVM的理解中,我可能會做類似於在[10e-5,10e5]範圍內以C爲10的指數執行初始網格搜索的操作,然後從那裏。但是,有沒有辦法可以快速估計出最佳C在10e3到10e5之間,然後執行更具體的搜索?SVM - 是否有可以指示最佳參數的數據屬性(例如,C,伽瑪)

這個問題可能適用於大多數ML技術,但我恰好現在正在使用SVM。

+1

而不是網格搜索,你可能想要檢查貝葉斯優化。例如:https://www.mathworks.com/help/stats/bayesian-optimization-case-study.html或https://thuijskens.github.io/2016/12/29/bayesian-optimisation/ – thc

回答

1

是的,這是一個積極的研究領域!除了我們都知道的標準網格搜索以及(也許?)愛之外,在超參數調諧的不同方法中已經做了很多工作。

與您所描述的內容最相似的區域是針對該問題的各種貝葉斯/高斯過程方法。這個github回購有一個實現和一些關於它如何工作的信息圖片https://github.com/fmfn/BayesianOptimization。這種方法的工作原理是將參數優化問題視爲另一個機器學習問題,其中我們爲每個超參數提供了特徵,並嘗試預測各種參數組合的性能。

這是對過程的高級描述,您可以閱讀回購中的鏈接論文/筆記本以瞭解更多詳細信息。