Python的NLTK book的第5章在句子中提供標記的話這個例子:Python NLTK:如何用簡化的詞性標記設置標記語句?
>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
nltk.pos_tag調用默認惡搞,它採用了全套的標籤。在本章後面介紹simplified set of tags。
如何使用這個簡化的詞性標籤集標記句子?
我也正確理解了標記器,也就是說,我可以更改標記器使用的標記集,或者我應該將它返回的標記映射到簡化集,還是應該創建新的標記器來自一個新的,簡單標記的語料庫?
非常感謝。 – 2011-04-26 20:40:13