我有一個基於用戶相似性的布爾偏好推薦。我的數據集基本上包含關係,其中ItemId是用戶決定閱讀的文章。我想添加第二個數據模型,其中包含ItemId是訂閱特定主題的位置。使用多重,加權數據模型的Mahout推薦
我可以想象做到這一點的唯一方法是合併兩者,抵消訂閱ID,以便它們不會與文章ID衝突。對於加權,我考慮放棄布爾偏好設置並引入偏好分數,其中文章子集的偏好分數爲1(例如),訂閱子集的偏好分數爲2.
我不確定是否這樣但是,因爲偏好分數並不完全類似於我之後的加權類型;他們可能包括一些代表不滿的低分數概念。
我不得不想象有一個更好的方法來做到這一點,或者至少是對我的計劃進行了調整,使其更符合我的願望。
我沒有看到多個數據集支持我Myrrix除了實驗示例:合併建議 – Hurda
我不是指合併模型。這裏,不同的數據集是用戶文章和用戶訂閱數據。兩者都可以添加到一個模型中,具有不同的權重。它們實際上並不重要,他們只能通過權重來定義。 –
所以我們可以用不同的權重重複輸入(相同的ID) - 它會被計算兩次(考慮到重量)? – Hurda