2013-06-19 58 views
0

我正在閱讀文件輸入並計算基於wordnet的相似性/相關性度量,如LIN,Banerjee和Pedersen度量(BNP),Jiang和Conrath度量(JNC)爲每行中的單詞。 我使用下面的代碼來獲取同義詞集:如何從wordnet中選擇所需的意義:python腳本中的synset

synsets=[] 
for entry in line1: 
    synsets.append(wn.synsets(entry)[0]) 

但這樣做讓我只能在correspong單詞的同義詞集的第一感覺。但在某些情況下,我可能需要第二或第三或根據單詞的不同而有其他意義。例如:對於水的第一個感覺是水,但我想選擇第二個,即「水體」。如何在沒有用戶提示的情況下使代碼更具有適應性?

回答

1

通常,當您測量單詞A和單詞B之間的相似度時,您將A的每種感覺與B的每種感覺進行比較,並將最接近的感官之間的相似度作爲您的相似度得分。

如果你有每個單詞的出現(...河的銀行......在銀行存錢...)的大背景下,你可以用它來決定「銀行」的相關意義。

+0

謝謝,這有助於:) – nish

相關問題