我使用中科院的中文Wordnet。它是Wordnet 1.6的翻譯。不幸的是,它不是免費的,必須購買,手冊基本上是指Wordnet的手冊。我想弄清楚的是如何比較兩個詞之間的相似性。我想這是用WordNetSynsetOffset完成的,但我無法在Wordnet網站上找到任何內容或有關如何使用它來比較兩個單詞的文檔。至於實際的算法,我想這是一個良好的開端http://marimba.d.umn.edu/similarity/measures.htmlWordnet同步偏移?如何比較單詞
<Record Conut="65">
<EnglishLemma>exercise</EnglishLemma>
<POS>Noun</POS>
<WordNetSynsetOffset Version="1.6">00469856</WordNetSynsetOffset>
<EnglishFrequancyRank>通用詞彙</EnglishFrequancyRank>
<ChineseTransList>
<ChineseTrans>
<ChineseLemma>例題</ChineseLemma>
<ChineseFrequancyRank>通用詞彙</ChineseFrequancyRank>
</ChineseTrans>
</ChineseTransList>
</Record>
我不完全理解你的問題 - 你發佈的鏈接是我認爲是「什麼是WordNet相似性度量標準」的問題的一個很好的答案。如果我沒有記錯,一個Synset id實際上是原始文件的偏移量,所以在這種情況下,「WordNetSynsetOffset」可能等於Synset Id。 – bwalenz 2011-04-15 16:13:38