我一直試圖爲TensorFlow中的GradientDescentOptimizer的每個步驟收集漸變步驟,但是當我試圖將apply_gradients()
的結果傳遞給sess.run()
時,我仍然遇到TypeError。我試圖運行的代碼是:無法爲TensorFlow中的GradientDescentOptimizer收集梯度
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
x = tf.placeholder(tf.float32,[None,784])
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
y = tf.nn.softmax(tf.matmul(x,W)+b)
y_ = tf.placeholder(tf.float32,[None,10])
cross_entropy = -tf.reduce_sum(y_*log(y))
# note that up to this point, this example is identical to the tutorial on tensorflow.org
gradstep = tf.train.GradientDescentOptimizer(0.01).compute_gradients(cross_entropy)
sess = tf.Session()
sess.run(tf.initialize_all_variables())
batch_x,batch_y = mnist.train.next_batch(100)
print sess.run(gradstep, feed_dict={x:batch_x,y_:batch_y})
需要注意的是,如果我有print sess.run(train_step,feed_dict={x:batch_x,y_:batch_y})
,其中train_step = tf.GradientDescentOptimizer(0.01).minimize(cross_entropy)
,錯誤是沒有提出替代的最後一行。我的困惑源於minimize
調用compute_gradients
與第一步完全相同的論點。有人可以解釋爲什麼發生這種行爲?
嗨,謝謝你的回覆。我並不想盡量減少優化器,我只是試圖在每一步打印出漸變。之所以我提出最小化計數器例子,是因爲它涉及調用compute_gradients,所以人們會認爲用相同的參數調用該函數也會產生錯誤。 –