我正在處理多義詞消歧項目,並試圖從輸入查詢中找到多義詞。我這樣做的方式是:如何從輸入查詢中找到多義詞?
#! /usr/bin/python
from nltk.corpus import stopwords
from nltk.corpus import wordnet as wn
stop = stopwords.words('english')
print "enter input query"
string = raw_input()
str1 = [i for i in string.split() if i not in stop]
a = list()
for w in str1:
if(len(wn.synsets(w)) > 1):
a.append(w)
這裏列出一個將包含多義詞的詞。 但使用這種方法幾乎所有的單詞都將被視爲多義詞。 例如,如果我的輸入查詢是「牛奶是白色的」,那麼它將存儲('牛奶','白色','顏色')爲多義詞
這是因爲所有這些單詞都有不止一種可能的含義。你的腳本似乎工作正常。 [看看WordNet](http://wordnetweb.princeton.edu/perl/webwn)。你會看到「牛奶」,「白色」和「顏色」都是多義性的。 – tsroten
我們不能說白色是多義詞,因爲wordnet中的所有感官都只與顏色有關......在銀行的情況下,某些感官與金融部門有關,有些與河岸有關,這就是爲什麼它被認爲是多義性。 – Madhusudan
*(adj)白色(仁慈的;沒有惡意的意圖)「這是你的白色」* - 與顏色無關。對我來說,看起來你正在爲你的代碼獲得正確的值。 – tsroten