1
如何區分function/structure words and content/lexical words?功能對比內容詞
我已經在使用StanfordCoreNLP,所以我想利用它,如果可能的話。
更具體地說,我應該使用哪個annotator以及它會如何標記內容/詞彙?
我試過pos
但它沒有區分功能和內容的話。
PS。我使用lemma
註釋器來獲取我想要忽略的單詞。
PPS。我使用pyconlp
。
如果您使用來自GitHub的Stanford CoreNLP版本,我們會使用它發佈停用詞列表。它在這個路徑:https://github.com/stanfordnlp/CoreNLP/blob/master/data/edu/stanford/nlp/patterns/surface/stopwords.txt – StanfordNLPHelp
這個鏈接顯示了一個在Java中使用API的例子:http ://stanfordnlp.github.io/CoreNLP/api.html – StanfordNLPHelp
所以你可以做的一件事是遍歷令牌,看看它們是否在停用詞表中。 – StanfordNLPHelp