我想運行一個基於U-net架構的圖像分割代碼。在實驗過程中,我發現Adam優化器比動量優化器運行速度慢得多。我不確定這兩個優化器之間是否有共同的觀察結果?還是應該是一個數據依賴的觀察?adam優化器和動量優化器
0
A
回答
0
使用Adam的優化比使用Momentum的優化運行緩慢,因爲前者需要累積每個參數的第一個和第二個時刻的指數移動平均值,因爲它是自適應學習率算法。 而後者不需要跟蹤過去的漸變,也不需要爲每個參數應用具有不同值的更新規則。
因此,您的觀察結果是正確的,但它不是數據相關的,它是優化算法本身需要做額外的計算,因此執行時間(每個訓練步驟)都較慢。
優點是使用自適應學習速率算法,即使單個步驟較慢,您的速度也會更快。
0
它可能取決於你的框架;例如,MxNet的這個問題:https://github.com/dmlc/mxnet/issues/1516。根據我的經驗,Adam傾向於與更少的時代交匯,儘管我意識到這與優化器運行速度並不相同。
相關問題
- 1. 在tensorflow中使用Adam優化器TWICE
- 2. TensorFlow:我如何重用Adam優化器變量?
- 3. JIT優化器是否優化乘法?
- 4. elasticsearch和過濾器優化
- 5. Javascript,CSS優化器
- 6. 編譯器優化
- 7. 編譯器優化
- 8. Flex Lexer優化器
- 9. alglib BLEIC優化器
- 10. 語言切換器,性能優化和搜索引擎優化
- 11. 傳統查詢優化器vs Pivotal查詢優化器
- 12. 是否有YUI3優化器與RequireJS優化器相似?
- 13. 凸優化 - matlab - 4D優化變量
- 14. 使用優化R優化矢量
- 15. C++優化/優化
- 16. 用jQuery優化圖像動畫以優化iPad優化
- 17. C++ - 常量和優化
- 18. 優化量詞和在Z3py
- 19. Php - 優化多個計數器增量
- 20. 由編譯器優化的變量
- 21. C優化器消除意外變量
- 22. C++ 0x優化編譯器質量
- 23. 高流量協助優化服務器
- 24. 編譯器優化與增量
- 25. GNU編譯器優化
- 26. 彙編語言優化器
- 27. 重置tensorflow優化器
- 28. PHP圖像優化器
- 29. SQLite觸發器優化
- 30. C++編譯器優化