2011-06-28 64 views
0

我正在使用solr進行搜索。在這裏我找到了一個synonym.text文件,你可以在其中爲你想要的單詞手動添加同義詞。在solr中包含同義詞

但是,正如我想這將是非常困難的手動包含每個詞的同義詞,因爲我的應用程序有大量數據。

我想知道有沒有什麼辦法,這synonym.text文件自動生成指所有詞典單詞

回答

0

那恕我直言不可能的。您至少需要兩個詞之間的語義關係,即令牌。如果你有類似數據庫的東西,包括語義同義關係,你當然可以生成這些數據。

一個示例源代碼將是wiktonary(XML轉儲:Link)。但可能有其他示例詞典可用,但我認爲你不會得到如此完整的源代碼。分析維基百科的XML轉儲可能是您的最佳選擇,如果您碰巧擁有多語言索引,甚至可以將不同語言的同義詞對齊。