6
採取正克我切實試圖解決同樣的問題,因爲這個問題一個數據庫:尋找從維基百科
Finding related words (specifically physical objects) to a specific word
減去的話代表物理對象的要求。答案和編輯問題似乎表明,一個好的開始是建立一個使用維基百科文本作爲語料庫的n-gram頻率列表。在我開始下載龐大的維基百科轉儲之前,有沒有人知道這樣的列表是否已經存在?
PS如果前一個問題的樓主看到這個,我很想知道你是怎麼去着手解決這個問題,因爲你的結果似乎優良:-)
是的,我認爲這個數據集 - 甚至比維基百科轉儲更可怕! – mojones 2010-02-24 10:54:13
它不可用於商業用途 – Joel 2010-09-17 10:20:51
有沒有人找到它的洪流? – placeybordeaux 2012-09-25 21:41:55