我已經使用這個代碼:pos_tag在NLTK沒有標記的句子正確
# Step 1 : TOKENIZE
from nltk.tokenize import *
words = word_tokenize(text)
# Step 2 : POS DISAMBIG
from nltk.tag import *
tags = pos_tag(words)
標記兩句話: 約翰是非常好的。約翰很好嗎?
約翰的第一句話是NN,而在第二個是VB!那麼,我們如何校正pos_tag函數而不需要訓練補償標記器呢?
修改問題:
我看到NLTK標註器在這裏http://text-processing.com/demo/tag/的示範。當我試圖選擇「英文標記加註& Chunckers:樹庫」或「布朗標註器」,我得到正確的標籤。那麼如何在沒有訓練的情況下使用Brown Tagger?
參見http://stackoverflow.com/questions/30821188/python-ntlk-pos-tag-not-returnig-the-correct-pos – alvas