我有POS標記與nltk.pos_tag()的一些單詞,所以他們給樹形標籤。我想用已知的POS標籤來解讀這些單詞,但我不知道如何。我在查看Wordnet lemmatizer,但我不確定如何將樹庫POS標籤轉換爲lemmatizer接受的標籤。我怎樣才能簡單地執行這個轉換,還是有一個使用treebank標籤的lemmatizer?用NLTK引導POS標記的單詞?
回答
詞網lemmatizer只知道四個部分的語音(ADJ,ADV,NOUN和VERB),只有NOUN和VERB規則做特別有趣的事情。樹庫標記集中的名詞詞性都以NN開頭,動詞標籤都以VB開頭,形容詞標籤以JJ開頭,副詞標籤以RB開頭。所以,從一組標籤轉換成另一種是很容易的,是這樣的:
from nltk.corpus import wordnet
morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]]
衛星形容詞怎麼樣? – user1048677 2016-08-10 22:05:49
衛星形容詞與普通形容詞一樣對待。 – rmalouf 2016-10-01 22:54:24
[penn_tag]從哪裏拉? Treebank標籤的列表? – Ksofiac 2017-07-24 20:50:07
- 1. nltk pos標記expletives
- 2. POS標記 - NLTK認爲名詞是形容詞
- 3. NLTK中單個單詞的標記器
- 4. 評估NLTK中的POS標記器
- 5. 自定義詞性標記與回退到nltk內部pos
- 6. Python NLTK PoS標記不準確
- 7. POS tagging - NLTK認爲名詞動詞
- 8. NLTK單詞詞性標註
- 9. 計算NLTK標記語句中(word,pos)元組的POS數量
- 10. 使用退避標記在nltk中標記pos
- 11. 在NLTK解析器語法中混合單詞和PoS標籤
- 12. 在R中爲單個單詞/標記創建POS標記
- 13. 如何使用NLTK(pos標記)獲得不定式形式的動詞
- 14. 檢查Nltk POS標籤
- 15. 使用NLTK中的POS標籤的CFG
- 16. 用於POS標記和Lemmatizer的多語言NLTK
- 17. 如何在給定POS標籤的NLTK中共軛動詞?
- 18. 在python中爲給定單詞提取不同的POS單詞nltk
- 19. R-POS pos()函數如何用於詞類標記
- 20. 使用POS標籤獲取單詞?
- 21. 在pos標記後提取形容詞
- 22. NLTK單詞lemmatizing
- 23. 更改NLTK樹葉中的POS標記的值
- 24. 用於簡單POS標記的NLP庫
- 25. Python:將NLTK Stanford POS標籤映射到WordNet POS標籤
- 26. nltk中的數字POS標記訓練(python)
- 27. POS標記NLTK語料庫中的正則表達式
- 28. 不希望NLTK單詞標記化將單個單詞'gotta'標記爲'got'和'ta'
- 29. NLTK無法找到斯坦福POS標記模型文件
- 30. 使用RNN的POS標記
我看這是「蒸POS」 – fizzer 2011-03-19 20:41:01
一些提示也可以在這裏http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik 2014-07-15 15:52:08