我想訓練一個非常大的模型。因此,我只能將非常小的批量放入GPU內存。使用小批量處理的結果非常有noisy gradient estimations。
我能做些什麼來避免這個問題?Caffe:如果只有一小批適合內存,我該怎麼辦?
11
A
回答
9
您可以在求解器參數中更改iter_size
。 Caffe在每個隨機梯度下降步驟中通過iter_size
x batch_size
實例累積梯度。 因此,如果由於內存有限無法使用較大的batch_size,那麼增加iter_size
也可以獲得更穩定的漸變。
4
相關問題
- 1. 如果我想在內存緩存中存儲一個None值,該怎麼辦?
- 2. 如果對象在Handlebars.js中只有一個值,該怎麼辦?
- 3. 如果拋出IOException,我該怎麼辦?
- 4. 如果我需要零大小的陣列,我該怎麼辦?
- 5. Caffe:如何選擇適合內存的最大可用批量大小?
- 6. 如果我知道Windows內核,我該怎麼辦?
- 7. 我該怎麼辦?
- 8. 如果在POM中只有父版本,該怎麼辦?
- 9. 如果我有一個演員,該怎麼辦應該有很大的節奏?
- 10. Erlang DETS有多大?如果它太小,該怎麼辦?
- 11. 如果我需要修改涼亭的內容,該怎麼辦?
- 12. 我該怎麼辦這個效果?
- 13. Matlab曲線擬合不適用於較小的值(1e-12),我該怎麼辦?
- 14. 如果帖子Meta不存在,我該怎麼辦?
- 15. 如果JPA真的只是一個規範,那我們該怎麼辦?
- 16. 如果我使用mmap而不是malloc分配內存,該怎麼辦?
- 17. 如果我沒有上下文,該怎麼辦?
- 18. 如果IE上沒有任何支持,我該怎麼辦?
- 19. 怎麼辦內複合鍵
- 20. 我該怎麼辦日期
- 21. 我該怎麼辦用C
- 22. GWT JDBC我該怎麼辦?
- 23. 「ConnectionResetError」我該怎麼辦?
- 24. SSL - 我該怎麼辦?
- 25. 我該怎麼辦在PHP
- 26. 如果setuptools未安裝,該怎麼辦?
- 27. 如果google.load失敗,該怎麼辦?
- 28. 如果DBCursor未關閉,該怎麼辦?
- 29. 如果mysql_query()失敗,該怎麼辦?
- 30. 如果collections.defaultdict不可用,該怎麼辦?
相關:http://stats.stackexchange.com/q/201775/66467 – Shai