我有這個link的代碼。它返回POS標籤及其出現編號。 我將如何實現代碼,而不是輸入標籤,而是輸入一個句子,並根據語料庫(本例中爲布朗語料庫)從每個單詞中返回單詞和不同的pos標籤。Python:如何從句子中計數pos標籤?
def findtags(tag_prefix, tagged_text):
cfd = nltk.ConditionalFreqDist((tag, word) for (word, tag) in tagged_text
if tag.startswith(tag_prefix))
return dict((tag, cfd[tag].keys()[:5]) for tag in cfd.conditions())
tagdictNNS = findtags('NNS', nltk.corpus.brown.tagged_words())
for tag in sorted(tagdictNNS):
print tag, tagdictNNS[tag]
for k,v in tagdictNNS.items():
new[k] = len(tagdictNNS[k])
print new
感謝編輯的EM新來的 – hamad
一些評論將是有益的。 – zero323