我是在Keras RNN結構中實現語言模型的新手。我有具有以下統計離散的話(而不是從一個段落)的數據集, 總字樣本:1953 明顯不同的字符的總數:33(包括開始,結束和*)一句話 最大長度(字符數)爲10 現在,我想建立一個模型,將接受一個字符和單詞預測下一個字符。我填充了所有單詞,以便它們具有相同的長度。所以我的輸入是Word_input形狀1953 x 9和目標是1953 x 9 x 33。
在機器學習中,通常用one-hot-encoding表示分類(特別是:標稱)特徵。我正試圖學習如何使用張量流的嵌入層來表示分類問題中的分類特徵。我已安裝tensorflow version 1.01,我正在使用Python 3.6。 我知道tensorflow tutorial for word2vec,但它對我的情況並不是很有啓發性。在構建tf.Graph時,它使用NCE特定的權重和tf.nn.