我有一個文本語料庫,我想從字符開始尋找單詞的嵌入。所以我有一系列字符作爲輸入,我想將它投影到多維空間中。學習使用已經學過的單詞嵌入的字符嵌入
作爲初始化,我想適應已經學過的單詞嵌入(例如,Google嵌入)。
我有些疑惑:
- 我需要用一個字嵌入矢量在輸入序列中的每個輸入 性格嗎?如果我只使用ascii或utf-8編碼使用 ,會不會是一個問題?
- 儘管什麼是輸入 矢量定義(VEC嵌入,ASCII ......)這真的混亂 選擇合適的型號有多種選擇,但林不知道 哪一個是更好的選擇:seq2seq,自動編碼器,lstm, multi-regressor + lstm?
- 你能給我任何樣本代碼 keras或tensorflow?
嗨朱塞佩,謝謝你的回覆,但是我真的需要角色嵌入,或者換句話說,在這種情況下,爲什麼我需要概括角色相似性? –