2011-10-13 78 views
2

我想知道如何檢索單詞之間的WordNet層次關係。WordNet是如何進來的

這是手動完成或通過計算機技術。

如果基於計算機技術,它們是什麼?

+0

一個很好的開始可能是http://wordnet.princeton.edu/wordnet/publications/ – tripleee

回答

5

從常見問題:

q.1.2你從哪裏獲得的共發現的定義是什麼? (簡短的回答)我們的 字典編纂者寫他們。

你從哪裏得到WordNet的定義? (很長的答案)從 前言WordNet:電子詞彙數據庫,頁。xviii-xix:

人們有時會問,「你從哪裏得到你的話?」我們從1985年開始,用庫切拉和弗朗西斯當代標準語料庫 編輯英語(俗稱布朗語料庫)中的詞開始,主要是 ,因爲它們爲不同詞類提供了頻率。 當亨利庫切拉告誡我們, 雖然他和弗朗西斯擁有布朗語料庫,但句法標記 數據已被出售給霍頓米夫林,我們很好地進入該名單。因此,我們放棄了我們的計劃 以使用它們的頻率計數(在1988年,理查德貝克威特開發了我們使用的多義詞索引 )。我們還整合了Charles Osgood用來開發語義差異的所有 形容詞對。因爲同義詞對我們來說非常重要,所以我們在各種同義詞中看到了單詞:例如,勞倫斯Urdang的 小小的「同義詞和反義詞的基本書」(1978),羅德爾的「The Synonym Finder」(1978)的Urdang的修訂 , ,和羅伯特查普曼的第4版 版「羅傑特國際詞庫」(1977年) - 在這樣的作品中, 一個詞迅速引向其他人。 1986年晚些時候,我們收到了由Fred Chang在海軍人事研究所編寫的文字清單 和 開發中心,我們將其與我們自己的清單進行了比較;我們驚訝地發現 只有15%的重疊。

So Chang的名單成爲輸入。而在1993年,我們獲得了名單 39143字,拉爾夫格里斯曼和他的同事在紐約 大學包括在他們的共同詞彙,COMLEX;這次我們對 感到沮喪,WordNet只包含了74%的COMLEX單詞。但那個 列表也成爲輸入。總之,各種來源有 貢獻;我們在建立詞彙方面並沒有很好的訓練。 事實上,英語詞彙非常龐大,我們很幸運 我們的贊助商耐心等待着我們,因爲我們慢慢地爬上了山峯 。