2014-02-25 88 views
1

我想查找多義詞的列表,但沒有在互聯網上得到任何東西。有人可以告訴我一個我能從中獲得的來源嗎?我想在我的詞義消歧項目的後端使用它來進行多義詞檢測機制。一詞多義詞列表

回答

4

http://ixa2.si.ehu.es/signatureak/SENSECORPUS.README.TXT

我們說的一句話就是monosemous,如果它具有獨特的意義,那就是,如果 一個字都有一個唯一的同義詞集合考慮到講話的一部分。

因此多義詞是一種多義詞。你可以從wordnet本身獲得這些信息。

結帳this

下面的工作:

from nltk.corpus import wordnet as wn 

def is_polysemous(word): 
    if(len(wn.synsets(word)) > 1): #more than 1 sense 
     return True 
    else: 
     return False 

您可以進一步通過增加POS資格的代碼。例如:

from nltk.corpus import wordnet as wn 

def is_polysemous(word): 
    if(len(wn.synsets(word, pos=wn.NOUN)) > 1): #more than 1 sense 
     return True 
    else: 
     return False 
+0

這不是有用的,因爲word中的所有單詞都有多個synset。有些synset是相關的,並且這個詞不能被認爲是多義性的。例如像美國,英國這樣的詞也被認爲是通過這種方法的多義性 – Madhusudan

+0

@Madhusudan然後你應該更清楚你認爲多義的東西。我爲我的定義和另一個例子添加了參考。 – axiom

+0

@Madhusudan也許你可以使用同義詞集之間的詞網樹中的距離作爲區分近似多義詞與明顯多義詞的方法嗎?但是,這個答案看起來對你所問的問題是正確的。 –

1

WordNet的每個版本都變得越來越精細。以名詞'line'爲例。在WordNet1.5中,它有6個感官,而WordNet3.0爲同一個名詞列出了30個感官。

@axiom給了你正確的答案,但是如果你不希望你的應用程序如此特殊,你可以使用你正在使用的WordNet版本,或者你可以使用所謂的「感知映射」相關感官從更大版本(例如3.0)轉換爲1.5中的相同感覺。 你可以在這裏找到一些感覺映射http://www.cse.unt.edu/~rada/downloads.html#wordnet或者,如果你想要不同的版本,你可以做你自己的映射。