2011-06-20 22 views
4

我正在開展一個項目,該項目有許多零售商獨立上傳他們的產品信息,換句話說,完全相同的產品可能有不同的名稱。例如,新的iPad或iPad或偉大的iPad等...設計問題:搜索產品或自動貼標籤產品? (搜索與機器學習)

我想呈現給用戶一個直觀的界面,以便當他搜索ipad或ipad時,他得到一個ipad與搜索結果的所有價格並列。或者可能是2個搜索結果,第一個與舊ipad和所有來自不同零售商的價格,另一個搜索結果與ipad 2以及另一個相鄰的價格。

具體的例子: 數據庫包含:新的iPad 1,iPad的1,偉大的iPad 1,新的iPad 2,iPad 2的,偉大的iPad 2 時爲iPad用戶搜索,他得到:

  • IPAD1:零售商的價格1 = $ 100,零售價格2 = 120 $等等
  • IPAD2:零售商的價格2 = $ 100,零售價格2 = 120 $等等

是這主要是一個搜索特定的問題? OR機器學習,自動標籤?

有沒有人知道一些已經在Rails3中實現的東西?

感謝

回答

1

據重複刪除的問題。地圖,目錄正在處理它。解決這個問題的方法有很多,取得不同的成功度。 最簡單的是識別同義詞和無用的單詞(好玩,有趣)等,並使用這些信息進行匹配。有些不清楚的情況應該送交人類審查。

示例「新Apple Ipad」vs「Great ipad」=刪除無用字=>「Apple ipad」vs「ipad」=等於子字符串/含糊不清=>等於