我相信這有一個簡單的答案!我要求提高我的理解力。CS231N第4講背部支柱鏈規則
的圖:的變形例:CS231N Back Propagation
如果該隱規則被施加到得到德爾塔用於Y,梯度是:dy = -4
根據圖。
應用鏈式法則記號:df/dy = df/dq * dq/dy
數控:
double x = -2;
double y = 5;
double q = 3;
double z = -4;
double f = -12;
double df = 1;
double dz = 3;
double dq = -4;
double dy = df * dq;
double dx = df * dq;
其中:df = df/df = 1
如上圖所示,並dq = df/dq = -4
如上所示。因此:1(df) * -4(dq) = -4(dy)
。或者我得到了這個完全錯誤的?
實際來自哪裏的數值,圖中的哪裏?這是一個僅限於漸變的數值鏈嗎?還是我們從其他輸入值派生?我問這裏的原因,是因爲在第48頁,有一個稍微混亂的代碼示例:
我在看的(/)符號,df/dy
,作爲一個部門,我認爲這是錯的? df/dy = df/dq * dq/dy
= 1/-4 * -4/-4
= 0.25 - 這裏的一個數字的目的是什麼?
難道df/dy
= dy
他們是同樣的事情,象徵df
dy
,這意味着一個梯度在時間倒流?
道歉,我有點困惑。