2011-07-30 346 views
0

我正在構建一項服務,用戶可以在其中提交他推薦/喜歡的鏈接(「文章,網站等)的鏈接」列表「,系統會向他顯示其他列表他也可能喜歡的鏈接。基於他的推薦向用戶推薦鏈接

在我的腦海做這個過程的唯一的想法是:

  1. 用戶A將提交其鏈接列表(例如10個鏈接)
  2. 系統將查找其他用戶(比如用戶B)列表與用戶A和用戶B之間80%相同的鏈接鏈接
  3. 顯示20%的新鏈接(從用戶B名單)用戶A

你有任何其他方式做到這一點?還是你有任何開源項目做同樣的事情?

任何語言是不錯,但我更到的Perl,PHP,Java和SQL

+1

開始閱讀這裏: - http://en.wikipedia.org/wiki/Recommender_system –

+0

謝謝高科技公司 – AFT

回答

1

你的做法是很容易實現。但是,正如我正在閱讀它,您正在配對用戶而不是鏈接。如果在80%以內找不到任何匹配,該怎麼辦?

我認爲一個更好的方法是建立一個鏈接作爲節點和連接的「相似性」分數的圖。 根據每個2個鏈接出現在同一個列表中的次數來計算分數。

如果您想爲用戶A推薦一個,那麼您將爲他的每個鏈接獲得評分最高的鏈接,這些鏈接不在他的列表中。

+0

好主意,謝謝 – AFT

0

我認爲具有完全相同的鏈接是不太可能的。更好的方法是下載每個鏈接並創建一個詞索引並嘗試匹配內容而不是鏈接。很像網絡搜索:)