0
我有一個非常標準的多對多關係。項目有很多標籤,反之亦然,通過關聯表。我想要做的是實現一個搜索引擎,其中用戶搜索特定項目,並且具有相似標籤數組的項目(不完全相同,這對於兩個項目具有完全相同的標籤是非常罕見的)將是返回,從最相似的到最不相似的順序排列。並且必須有一個截止點,這個項目需要返回的最小相似度。鐵軌搜索與類似協會的項目
任何人都可以指出我在正確的方向如何做到這一點?
我有一個非常標準的多對多關係。項目有很多標籤,反之亦然,通過關聯表。我想要做的是實現一個搜索引擎,其中用戶搜索特定項目,並且具有相似標籤數組的項目(不完全相同,這對於兩個項目具有完全相同的標籤是非常罕見的)將是返回,從最相似的到最不相似的順序排列。並且必須有一個截止點,這個項目需要返回的最小相似度。鐵軌搜索與類似協會的項目
任何人都可以指出我在正確的方向如何做到這一點?
您可以調整Levenshtein函數(通常用於比較字符串)以適合您的問題。只有一個可能的想法在快速...
嗯。問題在於,由於它是基於所需編輯的數量,因此代理服務器中關聯數量差異很大的任何兩個項目都不會被認爲是相似的。 – herpderp 2010-11-09 21:24:59
我想這是我最好的選擇。有一個levenshtein寶石,我會試試看。 – herpderp 2010-11-10 00:13:28