2017-05-27 49 views
0

我相信這有一個簡單的答案!我要求提高我的理解力。CS231N第4講背部支柱鏈規則

的圖:的變形例:CS231N Back Propagation Back Propagation Through Time

如果該隱規則被施加到得到德爾塔用於Y,梯度是:dy = -4根據圖。

應用鏈式法則記號:df/dy = df/dq * dq/dy

數控:

double x = -2; 
double y = 5; 
double q = 3; 
double z = -4; 
double f = -12; 

double df = 1; 
double dz = 3; 
double dq = -4; 
double dy = df * dq; 
double dx = df * dq; 

其中:df = df/df = 1如上圖所示,並dq = df/dq = -4如上所示。因此:1(df) * -4(dq) = -4(dy)。或者我得到了這個完全錯誤的?

實際來自哪裏的數值,圖中的哪裏?這是一個僅限於漸變的數值鏈嗎?還是我們從其他輸入值派生?我問這裏的原因,是因爲在第48頁,有一個稍微混亂的代碼示例: enter image description here

我在看的(/)符號,df/dy,作爲一個部門,我認爲這是錯的? df/dy = df/dq * dq/dy = 1/-4 * -4/-4 = 0.25 - 這裏的一個數字的目的是什麼?

難道df/dy = dy他們是同樣的事情,象徵dfdy,這意味着一個梯度在時間倒流?

道歉,我有點困惑。

回答