1
NLTK Wordnet中的IC文件之間的主要區別是否有任何文檔?Wordnet信息內容(IC)文件Python
具體來說,尋找brown_ic,semcor_ic,genesis_ic等之間的差異,所以我可以決定哪一個是最適合我的相似度努力字語料。
其他問題:完成所有上述相似的措施要求所有的單詞在同一POS?
NLTK Wordnet中的IC文件之間的主要區別是否有任何文檔?Wordnet信息內容(IC)文件Python
具體來說,尋找brown_ic,semcor_ic,genesis_ic等之間的差異,所以我可以決定哪一個是最適合我的相似度努力字語料。
其他問題:完成所有上述相似的措施要求所有的單詞在同一POS?
我想你需要分別谷歌每個語料庫。 http://www.nltk.org/nltk_data/的列表確實只給出了尺寸和許可證。
布朗語料庫是1961年美國英語,事實與虛構的混合。見https://en.wikipedia.org/wiki/Brown_Corpus
semcor是布朗語料庫的子集。
成因是根據http://nlpforhackers.io/corpora/聖經文本(這看起來對某些人有用的信息,太)
發現這裏的brown_ic一些細節:https://stackoverflow.com/questions/18705778/what-is-在 - 使用 - 的棕語料庫中-測量語義相似性爲基礎的上-wordne – Ksofiac