2016-09-29 27 views
1

我正在考慮使用Keras來實現文檔分類任務,但LSTM層的輸入令我感到困惑。如何在輸入圖層中爲文本分類生成「矢量」?

我知道我必須生成訓練矢量,我在這個語料庫中每行有一個語料庫和一個文檔,如果我想要將語料庫輸入到LSTM層,是否需要先生成文檔向量從語料庫進行培訓?或者不使用字級矢量或字符級矢量?

+0

請更具體一點。你能告訴我們你的數據是怎麼樣的嗎?你想要建模什麼?這個問題有點含糊。 – nemo

+0

@nemo,我的數據看起來像:文學標題,文學摘要。我的目的是一起訓練標題和相應的摘要。我正在考慮使用暹羅網絡進行培訓。 – Kun

回答

0

在文檔分類任務中,如果使用LSTM,輸出通常是字級矢量,可以是預先訓練的或隨機初始化的。您可以將字級矢量與字符級矢量相結合,例如https://arxiv.org/abs/1606.03475

+0

謝謝弗蘭克,但是我對輸出有點困惑,爲什麼它會是一個字級向量?這些向量意味着「類」的概率嗎?或者只是生成單詞向量? – Kun