0
我正在處理一個推薦問題,其中涉及300萬用戶和500,000個產品。該建議的目的是在訪問特定產品時向特定用戶推薦5-10個更多產品。大型推薦器
我們完成了實時推薦引擎部分,但我們發現在1-2秒內推薦並不那麼容易。我們認爲兩種策略:
運行建議脫機批處理模式,然後把結果存儲在MySQL的DB。但是,表格中的條目數量似乎是一個巨大的數字。每個產品的每個用戶應至少存儲5-10個推薦產品。如果我創建一個包含用戶和產品的表格作爲表格屬性,則會有300萬x 500,000條目。
預測飛行中的建議。我們只是試了一下,但響應時間太長了。
任何人都可以給我一些關於這個問題的建議嗎?
爲什麼你爲每個用戶生成每個項目? (只是好奇) – 2013-06-07 13:47:08
這取決於推薦引擎的工作原理 - 如果推薦引擎只關注客戶最近的購買(應該相對較少),並且在近期購買和推薦產品之間存在某種(有效)指數,那麼實時建議應該是相當可行的。你能否多給我們介紹一下推薦引擎的工作原理? – Justin 2014-01-09 14:41:18