回答

3

使用皮爾遜相關性的協作過濾存在一些問題。我會列出幾個大的國家:

  • 可擴展性
    當你的數據庫的增長,這將需要越來越長來計算用戶之間的Pearson相關。由於您必須計算每個用戶之間的相關性,因此它將呈指數級增長。

  • 數據稀疏
    這是大多數推薦引擎的一個大問題。如果您有很多用戶和很多項目以及少量評論,那麼生成建議將變得很困難,因爲您的數據太少而無法計算用戶之間的關聯。

  • 冷啓動問題
    從技術上講,每個方法從這個問題的困擾,但矩陣分解處理這不是協同過濾更好。冷啓動問題基本上意味着您沒有或幾乎沒有關於用戶的任何數據。當您使用協作過濾器時無法解決此問題。期。
    您可以使用替代技術來超越此問題,即基於內容的過濾。

確定您應該使用哪種方法可能很困難。矩陣分解性能優於傳統的基於用戶和基於項目的協作過濾,但您必須決定它是否最適合您的模型。
如果您沒有稀疏數據庫,協作過濾器將運行良好,但矩陣分解方法也是如此。

以下是一些有趣的網站,其中包含有關這些方法的數據。最後,由您或您的團隊決定哪種方法最適合。

隨意問更多,如果這還不夠清楚!

+0

矩陣分解也是一種協作過濾器。 – crackjack