1
目前我正在試圖拿出一個新的結構爲CLDNN(卷積,LSTM,深層神經網絡)優化的超參數進行深網絡
,就像任何其他的網絡,我有困難的時候,優化超參數。
我想嘗試網格搜索和隨機搜索,以獲得最佳的超參數集,但我不清楚幾件事情。
如果我用一組臨時超參數運行網絡模擬,我該如何衡量超參數的「好處」?我正在考慮在每次模擬的N個時代後記錄成本和訓練精度。由於每次模擬需要相對較長的時間(對於我的網絡來說,需要大約70秒來訓練一個時期),有沒有更快的方法來檢查超參數的「優」而不需要實際運行完整的訓練?
是否有超參數優化的一般提示/建議?
謝謝您的詳細解答!我猜測hyperoptimization沒有捷徑嗎?我可能需要運行整個一週的優化。 –