我正在使用基於項目的協作過濾器爲餐館創建推薦的推薦引擎。每家餐館的評論評分從1到5。
每個推薦算法都會遇到數據稀疏問題,所以我一直在尋找解決方案來計算正確的相關性。基於項目的協作過濾器的最小數據量
我在餐廳之間使用調整後的餘弦相似度。
當您想計算餐廳之間的相似度時,您需要評價這兩家餐廳的用戶。但是,對兩家餐廳進行評分以獲得正確關聯的用戶的最小數量是多少?
從測試中,我發現有一組用戶對兩家餐廳進行評分會導致不良的相似性(很明顯)。通常它是-1或1.所以我將它增加到了兩個同時擁有餐廳的用戶,這給了我更好的相似之處。我發現很難確定這種相似性是否足夠好。有沒有一種方法可以檢驗這種相似性的準確性,還是有關於最小值如何的準則?