協作過濾 - 矩陣分解與皮爾遜相關

對於推薦引擎，這些技術的優點和缺點（矩陣分解：ALS，皮爾遜或cossin相關）以及我們如何確定使用哪種技術。協作過濾 - 矩陣分解與皮爾遜相關

2016-04-29 oshribm

使用皮爾遜相關性的協作過濾存在一些問題。我會列出幾個大的國家：

可擴展性
當你的數據庫的增長，這將需要越來越長來計算用戶之間的Pearson相關。由於您必須計算每個用戶之間的相關性，因此它將呈指數級增長。
數據稀疏
這是大多數推薦引擎的一個大問題。如果您有很多用戶和很多項目以及少量評論，那麼生成建議將變得很困難，因爲您的數據太少而無法計算用戶之間的關聯。
冷啓動問題
從技術上講，每個方法從這個問題的困擾，但矩陣分解處理這不是協同過濾更好。冷啓動問題基本上意味着您沒有或幾乎沒有關於用戶的任何數據。當您使用協作過濾器時無法解決此問題。期。
您可以使用替代技術來超越此問題，即基於內容的過濾。

確定您應該使用哪種方法可能很困難。矩陣分解性能優於傳統的基於用戶和基於項目的協作過濾，但您必須決定它是否最適合您的模型。
如果您沒有稀疏數據庫，協作過濾器將運行良好，但矩陣分解方法也是如此。

以下是一些有趣的網站，其中包含有關這些方法的數據。最後，由您或您的團隊決定哪種方法最適合。

隨意問更多，如果這還不夠清楚！

2016-11-07 11:14:22 RandomStranger

矩陣分解也是一種協作過濾器。 – crackjack

回答