2017-01-11 54 views
2

我一語的詞形還原過程中有這樣的結果:斯坦福CorenNLP短語POS標籤和詞形還原解釋

收集的要求

使用這個詞組結果corenlp online tool,POS標記和詞形還原:

enter image description here

出於某種原因, 「聚集」 被賦予了POS- 「JJ」(「形容詞」)的標籤,這可能導致外稟被「聚集」而不是「聚集」。

如果輸入的短語是gathered requirements(即小寫),然後將POS標籤被正確地識別爲一個動詞,和詞形歸併的結果是我所期待的:

enter image description here

爲什麼CoreNLP識別Gathered作爲形容詞而不是動詞?

回答

2

當您編寫「收集的需求」時,系統檢查單詞「收集」中發生的最多POS標籤的概率。只有某些詞如命名實體,句首等以大寫字母開頭。當你用大寫字母開頭時,「聚集」更可能是JJ的一般原因是它在句子開始時主要用作形容詞而不是動詞。

+0

據我所知,「聚」和它的過去式都是動詞。我想不出任何一個英文句子,其中'gather'或'gather'是一個形容詞。你可以嗎? – Raman

+0

「收集的文件在辦公室舉行」,收集的是需求的形容詞。 – Alikbar

+0

「聚集的文件在辦公室舉行」這個短語中,「Gathered」是用作形容詞的過去分詞動詞,斯坦福大學的NLP將其標識爲(VBN而不是JJ,而且引理仍然是「聚集」)。所以,我仍然沒有看到任何與Gilt有關的例子,斯坦福NLP會認定爲JJ。 – Raman