1
TensorFlow:一種大型機器學習 系統(馬丁·阿巴迪,保羅·巴勒姆,建民陳,陳志峯...)
什麼術語「步時間「或」訓練步驟時間「是什麼意思?爲什麼不簡單地使用火車時間?
paper screenshot(沒有足夠的聲譽後直接圖像)
TensorFlow:一種大型機器學習 系統(馬丁·阿巴迪,保羅·巴勒姆,建民陳,陳志峯...)
什麼術語「步時間「或」訓練步驟時間「是什麼意思?爲什麼不簡單地使用火車時間?
paper screenshot(沒有足夠的聲譽後直接圖像)
在神經網絡場景中,曆元可以被定義爲一個單一的直傳和的所有訓練樣例向後通。我們不會一次將所有的神經元送入我們的網絡。相反,我們選擇一批神經元(小批量)並喂入。我們處理一小部分訓練數據向前和向後。我們這樣做是爲了能夠執行隨機梯度下降,並防止我們的網絡過度配合。個人訓練步驟時間和總訓練時間之間存在差異。例如,如果您的網絡中有30個訓練步驟,則總訓練時間=完成全部30個訓練步驟所需的時間。
請檢查參考[15]下表:
[15] S. Chintala. convnet-benchmarks, github.com/soumith/convnet-benchmarks.
對於AlexNet,CAFFE訓練步驟時間324女士。 總時間=正向+反向= 121 + 203