2012-07-01 163 views

回答

1

這看起來像是back-propagation計算神經網絡訓練誤差的梯度。 Bishop(244頁)中列出的一個關鍵公式爲:

δj = h'(aj) SUM(k, wkj δk) 

δ是隱藏的或輸出節點的預測和標值之間的誤差。右邊的δ條款已經被計算出來,並且對應於正在考慮的下一層輸出病房。

h'術語是非線性activation function的導數,其通常是sigmoid functiontanh。在您的圖片中列出的hm看起來像tanh的衍生變量的變化。

豎線是用於評估的語法:f(t) = f(x) | t。我無法確定圖像中的表情是什麼,我可能是錯的。