我一直在試圖從褐色語料庫得到所有的名詞,verbs..etc分開,所以我試圖用代碼如何從棕色語料庫中獲得動詞,名詞,形容詞?
brown.all_synsets('n')
但顯然這個代碼的工作,只有WORDNET。順便說一句,我正在使用python 3.4。
EDITED
@alvas答案的工作。但是,當我隨機使用它會得到一個錯誤。看一看。
nn = {word for word, pos in brown.tagged_words() if pos.startswith('NN')}
print(nn)
輸出
{'such', 'rather', 'Quite', 'Such', 'quite'}
但是當我使用
random.choice(nn)
我得到
Traceback (most recent call last):
File "/home/aziz/Desktop/2222.py", line 5, in <module>
print(random.choice(NN))
File "/usr/lib/python3.4/random.py", line 256, in choice
return seq[i]
TypeError: 'set' object does not support indexing
歡迎來到StackOverflow。請不要發佈答覆回答其他答案,而是編輯您的問題,請參閱http://stackoverflow.com/help/how-to-answer – alvas
這是如何在布朗標記單詞,沒有選擇,只能接受標籤,因爲他們大多被視爲金/銀標準(即地面真相)。 – alvas
你確定你在輸出中'比較'嗎?我沒=( – alvas