我正在尋找一種方法來爲我在R中的列表中的單個詞/標記創建POS標記。我知道,如果我爲單個標記執行此操作,準確性會降低而不是句子,但我擁有的數據是來自維基百科的「刪除編輯」,人們大多刪除單個不連接的單詞而不是整個句子。我幾次看到這個問題的Python,但我還沒有找到它在R的解決方案。在R中爲單個單詞/標記創建POS標記
我的數據看起來somehwat這樣
Tokens <- list(c("1976","green","Normandy","coast","[", "[", "template" "]","]","Fish","visting","England","?"))
理想情況下,我想有這樣的事情返回:
1976 CD
green JJ
Normandy NN
coast NN
[ x
[ x
template NN
] x
] x
Fish NN
visiting VBG
England NN
? x
我發現了一些websites這樣做在線,但我懷疑他們在R中運行任何東西。他們還特別聲明不要在單個單詞/令牌上使用它。
因此我的問題:是否有可能以合理的精度在R中做到這一點?代碼如何看起來不包含句子結構?將列表與一個大型標籤日記進行比較會更容易嗎?
以上答案僅適用於spacy 1.0 您必須閱讀spacy 2.0文檔以獲取新方法。 –