大約有計算一個熱的嵌入與TensorFlow幾個堆棧溢出的問題,這裏是接受的解決方案:這是TensorFlow中的一種熱門編碼嗎?或因任何原因有缺陷?
num_labels = 10
sparse_labels = tf.reshape(label_batch, [-1, 1])
derived_size = tf.shape(label_batch)[0]
indices = tf.reshape(tf.range(0, derived_size, 1), [-1, 1])
concated = tf.concat(1, [indices, sparse_labels])
outshape = tf.reshape(tf.concat(0, [derived_size, [num_labels]]), [-1])
labels = tf.sparse_to_dense(concated, outshape, 1.0, 0.0)
這是一個官方教程幾乎相同的代碼:https://www.tensorflow.org/versions/0.6.0/tutorials/mnist/tf/index.html
要我似乎自從tf.nn.embedding_lookup
存在,它可能更有效率。這是一個使用這個版本,它支持任意形狀的輸入:
def one_hot(inputs, num_classes):
with tf.device('/cpu:0'):
table = tf.constant(np.identity(num_classes, dtype=np.float32))
embeddings = tf.nn.embedding_lookup(table, inputs)
return embeddings
您是否期望此實現更快?是否有其他原因存在缺陷?
'劣質'是一種主觀的質量。你能以客觀的方式表達出來嗎?例如時間,記憶,產生錯誤;可以衡量的東西。 –
你對TensorFlow開發人員的要求是顯而易見的,但這不是我的要求。我發現TensorFlow的例子很實用:不止一次,我認爲我正在改進一些東西,後來認識到他們在設計時非常小心(儘管缺乏文檔)。對我而言,這種單熱編碼器更好(更可讀,更通用,可能更快),但是我要求以我沒有看到的方式查看它是否有缺陷。 – rd11
我明白。我添加了評論,因爲StackOverflow對問題有特定的要求,如果新人看到這個問題,他們可能會開始提出更多不被允許的主觀問題。 TensorFlow標籤更加寬容,但如果標準沒有保留,標籤將變得毫無價值,我想長期使用它。 –