1
來自Caffe tutorial狀態:caffe在做什麼簿記?
淨是一組連接在一個計算圖的層 - 一個有向非循環圖(DAG)是精確的。 Caffe爲任何DAG層都做了所有簿記以確保正向和反向通過的正確性。
「全部簿記」是什麼意思?我不明白。
如何做所有的簿記?
來自Caffe tutorial狀態:caffe在做什麼簿記?
淨是一組連接在一個計算圖的層 - 一個有向非循環圖(DAG)是精確的。 Caffe爲任何DAG層都做了所有簿記以確保正向和反向通過的正確性。
「全部簿記」是什麼意思?我不明白。
如何做所有的簿記?
與許多其他深度學習框架一樣,Caffe使用隨機梯度下降(SGD)訓練其模型,實現爲梯度反向傳播。也就是說,對於一小批培訓實例,caffe通過網絡饋送批量(「正向傳遞」)來計算網絡參數的損失。然後,它將損失梯度傳回(「反向傳遞」)以根據估計的梯度更新所有參數。
通過「簿記」教程意味着,您不必擔心估計漸變和更新參數。一旦你使用了現有的圖層(例如,"Convolution"
,"ReLU"
,"Sigmoid"
等),你只需要定義圖形結構(網絡的體系結構)並提供訓練數據,並且caffe將負責其餘的訓練過程:將向前/向後每個小批量,計算損失,估計梯度和更新參數 - 全部爲您。
非常棒,你不覺得嗎? ;)