2013-04-25 70 views
3

我有一個單詞列表。我正在尋找一種將這些單詞語義聚合在一起的方法。任何人都可以告訴我一個圖書館或工具,完成這個?我一直在網上搜索很多,但沒有適合我的要求。大部分詞彙是技術性的,因此在任何詞典中都不會找到。我想在單詞列表上執行本體聚類。集羣字

回答

2

你有一個集合,所以你將有一個上下文來處理?

如果公頃給定集合可以使用可以計算每對術語一起出現的文檔數,並基於該計算它們之間的一些語義相似度等 [傑卡德](http://en.wikipedia.org/wiki/Jaccard_index)或[骰子]( http://en.wikipedia.org/wiki/Dice%27s_coefficient)。

+0

感謝您的想法.....你能指導我哪種類型的聚類最適合我的目的嗎? – user2115183 2013-04-26 21:23:46

+1

[K-means](http://en.wikipedia.org/wiki/K-means_clustering)應該是一個很好的開始點 – miguelmalvarez 2013-04-27 08:32:32

+1

這個問題叫做: 頻繁項集挖掘。你可以在Ullman的書「海量數據挖掘」中找到相關信息。 – Nikaidoh 2016-03-06 19:58:02