我正在嘗試爲產品推薦的基於項目的協作過濾編寫一些代碼。該輸入具有買方作爲行和列作爲產品,具有簡單的0/1標誌來指示買方是否購買了物品。輸出是一個列表類似項目的一個給定的購買,按餘弦相似性排序。評估針對二進制(是/否)產品推薦的基於項目的協作過濾的性能
我正在嘗試測量幾個不同實現的準確性,但我不確定最佳方法。我發現大多數文獻都提到使用某種形式的均方誤差,但當您的協作過濾算法預測評分(例如4星滿分)時,這看起來更適用,而不是推薦用戶購買哪些項目。
一種方法我正在考慮是如下...
- 分割的數據爲訓練/套抵抗,訓練數據
- 對於組中的每一個項目(A),從選擇數據火車抵抗設置,用戶買了
- 確定哪些A-買家的比例買了,購房者的前3名的建議之一
上面似乎有點武斷,但我認爲這可能是使用當在相同的數據上訓練時,比較兩種不同的算法。