2016-09-25 54 views
0

我有一個特定的分析梯度,我用它來計算我的成本f(x,y)和梯度dx和dy。它運行,但我不知道我的梯度下降是否被破壞。我應該繪製我的偏導數x和y嗎?代碼不匯聚香草梯度下降

import math 

gamma = 0.00001 # learning rate 
iterations = 10000 #steps 
theta = np.array([0,5]) #starting value 
thetas = [] 
costs = [] 

# calculate cost of any point 
def cost(theta): 
    x = theta[0] 
    y = theta[1] 
    return 100*x*math.exp(-0.5*x*x+0.5*x-0.5*y*y-y+math.pi) 

def gradient(theta): 
    x = theta[0] 
    y = theta[1] 
    dx = 100*math.exp(-0.5*x*x+0.5*x-0.0035*y*y-y+math.pi)*(1+x*(-x + 0.5)) 
    dy = 100*x*math.exp(-0.5*x*x+0.5*x-0.05*y*y-y+math.pi)*(-y-1) 
    gradients = np.array([dx,dy]) 
    return gradients 

#for 2 features 
for step in range(iterations): 
    theta = theta - gamma*gradient(theta) 
    value = cost(theta) 
    thetas.append(theta) 
    costs.append(value) 

thetas = np.array(thetas) 
X = thetas[:,0] 
Y = thetas[:,1] 
Z = np.array(costs) 

iterations = [num for num in range(iterations)] 

plt.plot(Z) 
plt.xlabel("num. iteration") 
plt.ylabel("cost") 
+0

看起來你試圖找到一個最小值,但是這個函數在任何一行y = c上都是無限的,因爲x - > inf inf。 –

回答

2

我強烈建議您通過首先對數值梯度進行評估,檢查分析梯度是否正常工作。 即確定你的f'(x)=(f(x + h) - f(x))/ h對於一些小的h。

之後,通過選擇一個你知道x或y應該減少的點,然後檢查你的漸變函數輸出的符號,確保你的更新實際上是在正確的方向。

當然要確保你的目標實際上是最小化與最大化。