給定一個單詞如「table」,我想確定它最常用的名稱,它最常用的用法是名詞,動詞還是形容詞。我想在python中做到這一點。除了wordnet以外還有其他的東西嗎?我不喜歡wordnet。或者,如果我使用wordnet,我將如何完全使用它?將單詞識別爲名詞,動詞或形容詞
0
A
回答
5
import nltk
text = 'This is a table. We should table this offer. The table is in the center.'
text = nltk.word_tokenize(text)
result = nltk.pos_tag(text)
result = [i for i in result if i[0].lower() == 'table']
print(result) # [('table', 'JJ'), ('table', 'VB'), ('table', 'NN')]
4
如果你有一個詞斷章取義,想知道它最常見的用途,你可以看看別人的頻率表(例如共發現),或者你可以做自己的罪狀:只要找到一個標籤足夠大的語料庫用於您的目的,並計算其實例。如果你想使用免費的語料庫,NLTK包括布朗語料庫(100萬字)。 NLTK還提供了處理較大的非自由語料庫(例如英國國家語料庫)的方法。
import nltk
from nltk.corpus import brown
table = nltk.FreqDist(t for w, t in brown.tagged_words() if w.lower() == 'table')
print(table.most_common())
[('NN', 147), ('NN-TL', 50), ('VB', 1)]
相關問題
- 1. 如何識別形容詞或副詞?
- 2. 動詞/名詞/形容詞形式之間的單詞轉換
- 3. 單詞的名詞,動詞,形容詞等的單獨列表
- 4. 名詞,動詞,形容詞等的單詞列表
- 5. 名詞/形容詞/其他詞典或詞典(普通詞)
- 6. 如何分別獲取名詞,動詞,形容詞synset?
- 7. 將形容詞和副詞轉換爲名詞形式
- 8. 識別單詞
- 9. 爲副詞和形容詞獲取相應的動詞和名詞
- 10. 創建詞的其他形式[名詞,形容詞,複數,動詞..一切]
- 11. 在Java中將單詞轉換成他們的名詞/形容詞/動詞形式
- 12. Perl模塊查找單詞是否是動詞/名詞/形容詞/文章/介詞
- 13. 如何命名爲形容詞或介詞的Rails資源?
- 14. 從動詞獲取名詞詞網
- 15. 從名詞詞組獲得動詞python
- 16. 名詞同義詞詞網
- 17. Xcode不識別單詞「class」
- 18. 如何從棕色語料庫中獲得動詞,名詞,形容詞?
- 19. POS標記 - NLTK認爲名詞是形容詞
- 20. 爲「High Score」建議的動詞/名詞
- 21. POS tagging - NLTK認爲名詞動詞
- 22. 在Python3與nltk如果某個單詞是動詞,如果某個單詞是動詞,名詞.etc
- 23. 將單詞替換爲除Python中的名詞和形容詞之外的特殊字符串
- 24. 使用詞網找到沒有名詞同義詞或至少有一個名詞同義詞的詞條
- 25. 如何訓練斯坦福德LexicalizedParser識別新單詞作爲名詞?
- 26. 形容詞功能
- 27. 非英語單詞的詞形化?
- 28. 單詞列表的詞形化
- 29. 接口命名爲形容詞
- 30. 分割的正則表達式 - 將單詞拆分爲詞素或詞綴
您需要詞性標記(http://www.nltk.org/book/ch05.html)。 – Vidul
Wordnet對於一個詞的每個* sense *有一個頻率(例如'table')。但是自2003年以來這一點並沒有得到更新(據我所知)。更好的選擇是下載Google n-grams並在該數據集上進行POS標記。 –
你打算如何使用POS標籤5字ngrams?這個想法是沒有開始的。但谷歌確實提供了由第一個詞的POS分類的[ngram文件](http://storage.googleapis.com/books/ngrams/books/datasetsv2.html),所以這將是一種廣泛計數的方法。如果你有磁盤空間,並真的需要通過這麼多的數據。 – alexis