2016-04-29 49 views
1

我使用RNN實現了POS標記。有3個功能,如果當前字是W_i:使用RNN的POS標記

  • 特點1 W_i-2,W_i-1,W_i,W_i + 1,W_i + 2
  • 特徵2:特徵1,2個字符的後綴
  • 特徵3:[如果W_i是所有大寫字母,如果W_i是所有小寫,如果 W_i的第一個字符是大寫]

在我的模型,我有兩個RNNs,對於特徵1和特徵2,然後連接RNN和特徵3的輸出,然後是softmax。特徵1的RNN是雙向的。

我在賓夕法尼亞銀行試過我的模型,但準確度很低(<在培訓和評估中均爲50%)。只是想知道,如果有人知道在python中使用RNN(基於單詞的功能)的開源POS標記器,我可以將其與我的模型進行比較,那麼我可以發現在我的代碼中是否存在錯誤,或者僅僅是因爲此模型不工作。

謝謝,

+0

你有沒有調查這個https://spacy.io/blog/part-of-speech-pos-tagger-in-python – GavinBrelstaff

+0

@GavinBrelstaff,感謝您的鏈接。我可以看到它在WSJ數據集上表現非常出色。但是,它使用感知器,我正在尋找一種深度學習RNN方法實現。再次感謝。 – user200340

回答

0

有一個是使用雙向LSTM和CRF實現的。它可以發現here.