2016-07-31 35 views
0

當我通過TreeAnnotation運行這兩個幾乎相同的句子時,爲什麼會得到這樣不同的分析樹?第一個正確返回 「SQ(VBZ一樣)..)」 模式,卜第二個顯示爲 「S(NP(NNP一樣)......」。這是一個錯誤?謝謝。解析器輸出差異幾乎相同的句子 - 爲什麼?

  1. 不他有時間嗎?(根據(NP(PRP he))(VP(VB有)(NP(NN時間)))(。?))(根據NP(PRP he) (ROOT(S(NP(NNP確實)(NNP約翰))(VP(VBP有)(NP(NN時間)))())。?)

回答

0

可愛 - 這看起來像一個POS標記錯誤。在第一個CAS中e,「是」被正確標記爲VBZ;在第二個,它被錯誤地標記爲專有名詞(NNP)。可能的是,這是POS tagger中的序列模型搞亂了:既然「Does」和「John」都是大寫,那麼它更喜歡將它們標記爲專有名詞。

+0

的確如此 - 如果我將「Does」改爲「does」,那麼我會得到VBZ ......有趣。我想這與雌鹿有點混淆。 –

+0

但是,這裏是一個益智遊戲:首字母大寫與否:「安排預約」給出(根據NP(NP(NN時間表))(NP(DT an)(NN任命)))),而「安排預約「產生(ROOT(S(VP(VB Schedule)(NP(DT an)(NN appointment)))))。我預計在這兩種情況下都會有相同的產出 –

相關問題