2016-08-04 26 views
1

在我正在開發的一個應用程序中,我需要知道一串單詞是否是名詞短語,動詞短語等。我瞭解NP和VP既不是依賴關係也不是POS。我也明白,要做到這一點,我可能需要某種分塊工具,但我找不到任何開源軟件。使用SyntaxNet進行分塊?

在SyntaxNet對句子的輸出「她真的很喜歡可愛的黑色狗」:

likes VBZ ROOT 
+-- She PRP nsubj 
+-- really RB advmod 
+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

我注意到,NP「可愛的黑色狗」已經放在自己的樹節點:

+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

所以我想知道如果有反正我可以使用SyntaxNet作爲chunker?

+0

a *選區分析器會告訴你你是否有NP,VP等。 – reynoldsnlp

回答

1

老實說,有精確的快速chunkers(如NLTK)在那裏,我不明白爲什麼要使用依賴分析樹來提取塊。

雖然您可以看看this google sample code(這不提供大塊,但主題,對象和動詞),可能對您的應用程序有用,並給你一些線索,以定義正則表達式提取大部分名詞短語。