2016-11-24 78 views
1
  1. 我在最新的tensorflow示例中找到了這個函數,但它不在API中。我不知道爲什麼。請幫助我,謝謝。

回答

2

它是開源的。你可以閱讀的文檔字符串和代碼here

+0

非常感謝你! – user7204017

+0

不要評論感謝我 - 這就是投票和接受的答案! –

10

我會給出一個example.I有一個數據集看起來是這樣的:

[("Garbage piles in the city","Garbage"), ("City is clogged with vehicles","Traffic")]

我想利用這是每個元組的第一個元素一連串的單詞。單詞需要嵌入到矢量形式中。 作爲第一步,它們應該轉換爲索引或數字。例如,在這種情況下, ,詞彙表將爲

[{Garbage:1},{piles:2},{in:3},{the:4},{city:5},{is:6},{clogged:7},{with:8},{vehicles:9}]

編碼的文本看起來像這 -

features=[[1 2 3 4 5],[5 6 7 8 9]].

你通過這個編碼的文本爲features在batches- tf.contrib.layers.embed_sequence此功能( 功能,vocab_size = n_words, embed_dim = EMBEDDING_SIZE,scope ='words')

現在,使用索引(1到5)表示的每個單詞都嵌入到EMBEDDING_SIZE的向量中。

如果批量大小爲2(即,在一個批次2組的序列),EMBEDDING_SIZE是10在我們的情況下,輸出將是維度的矩陣2×5×10

樣品輸出 - [[[0.1,0.3,0.4,0.2,0.5,0.2,0.2,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.4,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.3,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.6]],[sent2]]

sent2被類似地編碼(5×10矩陣)。

希望這是明確的。