2016-12-02 36 views
1

我遇到以下示例,我不知道可以按如下方式饋送RNN狀態。Tensorflow饋送初始RNN狀態

self.cell = cell = rnn_cell.MultiRNNCell([cell] * args.num_layers, state_is_tuple=True) 
self.input_data = tf.placeholder(tf.int32, [args.batch_size, args.seq_length]) 
self.targets = tf.placeholder(tf.int32, [args.batch_size, args.seq_length]) 
self.initial_state = cell.zero_state(args.batch_size, tf.float32) 

在這段代碼中,初始狀態被聲明爲歸零狀態。據我所知,這不是一個佔位符。這只是一個零張量的圖。

然後在使用RNN模型生成初始狀態的函數中輸入session.run。

def sample(self, sess, chars, vocab, num=200, prime='The ', sampling_type=1): 
    state = sess.run(self.cell.zero_state(1, tf.float32)) 
    for char in prime[:-1]: 
     x = np.zeros((1, 1)) 
     x[0, 0] = vocab[char] 
     feed = {self.input_data: x, self.initial_state:state} 
     [state] = sess.run([self.final_state], feed) 

由於self.initial_state不是佔位符,它如何能夠獲得session.run?

這裏是我正在查看的代碼的鏈接。 https://github.com/sherjilozair/char-rnn-tensorflow/blob/master/model.py

回答

2

請注意,您可以輸入任何變量,而不僅僅是佔位符。因此,在這種情況下,您可以手動輸入元組的每個元素:

feed = { 
    self.input_data: x, 
    self.initial_state[0]: state[0], 
    self.initial_state[1]: state[1] 
}