2011-03-19 63 views
15

我有POS標記與nltk.pos_tag()的一些單詞,所以他們給樹形標籤。我想用已知的POS標籤來解讀這些單詞,但我不知道如何。我在查看Wordnet lemmatizer,但我不確定如何將樹庫POS標籤轉換爲lemmatizer接受的標籤。我怎樣才能簡單地執行這個轉換,還是有一個使用treebank標籤的lemmatizer?用NLTK引導POS標記的單詞?

+3

我看這是「蒸POS」 – fizzer 2011-03-19 20:41:01

+1

一些提示也可以在這裏http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik 2014-07-15 15:52:08

回答

28

詞網lemmatizer只知道四個部分的語音(ADJ,ADV,NOUN和VERB),只有NOUN和VERB規則做特別有趣的事情。樹庫標記集中的名詞詞性都以NN開頭,動詞標籤都以VB開頭,形容詞標籤以JJ開頭,副詞標籤以RB開頭。所以,從一組標籤轉換成另一種是很容易的,是這樣的:

from nltk.corpus import wordnet 

morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]] 
+0

衛星形容詞怎麼樣? – user1048677 2016-08-10 22:05:49

+0

衛星形容詞與普通形容詞一樣對待。 – rmalouf 2016-10-01 22:54:24

+0

[penn_tag]從哪裏拉? Treebank標籤的列表? – Ksofiac 2017-07-24 20:50:07