我讀過this article,它看起來像是給了足夠的內存,你應該總是在其他可能的優化算法中使用Adam(adadelta,rmsprop,vanilla sgd等)。有沒有任何例子,無論是玩具還是現實世界,Adam都會比其他算法做得更差?我認爲,對於大多數密集投入而言,主要是凸面的損失函數,您可能會加快與vanilla SGD的融合,但您仍然需要調整您的學習時間表和需要一些時間的東西。不使用tf.train.AdamOptmizer的理由?
0
A
回答
0
我傾向於使用vanilla sgd,只要我仍然在獲得一般的圖形佈局的權利,因爲ADAM和AdaGrad帶來了很多矩陣 - 開銷與他們,使調試真的很難。但是一旦你有了你的模型並且想要進行規模訓練,我想ADAM,AdaGrad和rmsprop就是選擇。我個人的經驗是,在seq2seq任務上工作AdaGrad非常高效和穩定。
0
相關問題
- 1. 任何不使用字典的理由
- 2. 有沒有理由不使用JSONP?
- 3. 有什麼理由不使用OpenID?
- 4. 使用.htaccess處理路由
- 5. 處理不可用的路由
- 6. 任何不使用USE_ETAGS與Django中的CommonMiddleware的理由?
- 7. 使用日期的任何理由?
- 8. PHP:使用Goto的有效理由?
- 9. ASP.NET MVC - 使用App_Themes的任何理由?
- 10. 使用Apache代理的Node.js路由
- 11. $ sql和$ result - 使用兩者的理由?
- 12. 使用C的字符串理由
- 13. 是否有理由不使用Pressflow而不是Drupal 6?
- 14. 使用compose()而不是lambda表達式的任何理由?
- 15. 爲什麼不使用XIB文件的好理由?
- 16. 在web api中使用不同處理程序的路由asp.net
- 17. 任何不使用`new object()。foo()`的理由?
- 18. 任何不顯式使用/ usr/bin/env python2/python3的理由?
- 19. 有沒有理由不使用document.getElementById的簡寫?
- 20. 我們有沒有任何理由不使用UIImageView的子類?
- 21. 是否有充分的理由使用CassiniDev而不是VS WebServer?
- 22. 任何不使用Angular CLI入門的理由?
- 23. 有什麼理由不使用Backbone.Model對Node.js的後端?
- 24. 不使用<script defer>今天有什麼好的理由?
- 25. 有沒有理由不使用NUnit的AssertionHelper?
- 26. 任何使用.php擴展名的理由 - 不是.html - 如果所有的PHP都由Ajax處理?
- 27. 由用戶而不是管理
- 28. 文本對齊理由不起作用?
- 29. SqlException不是由用戶代碼處理....'('
- 30. 由用戶代理mod_rewrite不工作?
我見過人們比'AdamOptimizer'更喜歡動力,因爲它對稀疏梯度效果更好 –