2014-09-25 62 views
3

我正在研究涉及不同概念之間相關性計算的項目。查找不同詞語之間的語義相似性和關係

例子: 「落地」 - 與「到達;來」和「土地」, 「電話」 - 與「電子,電力」和「談話;溝通」, 「電影「 - 相關:」移動;改變「和」圖片;圖片「 等等。

我檢查了WordNet框架和WordNet :: Similarity Perl模塊,但在某些情況下它們不可用,特別是在需要將名詞與動詞連接的情況下(例如名詞「dog」和動詞「大叫」)。此外,WordNet組織所有同層次結構(例如:計算機 - >機器 - >設備 - >儀表),這並不是我真正需要在我的項目中(當然,我可能是錯的)。

問題是 - 哪個框架或數據庫,我應該用什麼方法來解決問題?我從哪說起呢?

如果你能給我一些建議,這將是非常有益的。

+0

你需要組織你的需求的相似性,關係和語義。我認爲「登陸」與「陸地」之間的關係以及「登陸」與「到達」之間的關係是不同語義的關係。你可能需要一個可以處理單詞之間的語義和關係的框架。 – 2014-09-25 04:27:45

+0

您應該利用WordNet中的「衍生詞相關形式」來將名詞與動詞聯繫起來。但是......理解概念相關性的「真實」(即research'y)方法是通過使用它們在大型數據集上的分佈相似性對詞進行建模。 – 2014-09-30 18:39:02

回答

3

word2vec嵌入可能在你的任務上做得很好。它給出了一個比wordnet更柔和的相似概念。您可以從https://code.google.com/p/word2vec/獲得一些預先訓練好的嵌入。

相關問題