2
在我們的例子中,我們有用戶的點擊流,項目的屬性(如類別,標籤等),關於項目的收藏夾和項目的集合。我們如何將這些數據組合成Myrrix的輸入數據?我們如何結合Myrrix中的多種數據類型來推薦?
在我們的例子中,我們有用戶的點擊流,項目的屬性(如類別,標籤等),關於項目的收藏夾和項目的集合。我們如何將這些數據組合成Myrrix的輸入數據?我們如何結合Myrrix中的多種數據類型來推薦?
基本上,您正試圖建模用戶和項目之間的交互。您將對不同交互進行建模的方式是通過爲每個交互分配強度指示符。例如,你可以爭辯說,點擊有2的優勢,最喜歡的強度是5,也可能是購買力量15(我只是說我的頭頂數字)。輸入數據的
例子:
user1,item1,2 => he view the item
user1,item1,5 => he made the item a favorite
user1,item1,15 => he purchased the item
現在,在內部,Myrrix將增加所有這些值,以表明該項目相當強烈的偏好,因此你會保持所有交互(而不僅僅是最強的)
您可能對用戶或項目的元數據也可以作爲「標籤」引入Myrrix以更好地告知模型。所以你可以說一個用戶是「女性」或一件物品是「牛仔褲」。每個用戶或項目可以有多個標籤,每個標籤也可以分配一個權重。
我同意。我可以添加更多的指導方針:http://myrrix.com/tuning-quality/例如,權重可以通過數據中的相對頻率進行選擇。 20倍以下的東西可以重20倍。此外,請將新的「標籤」API作爲添加類別/標籤信息的便捷方式:http://myrrix.com/rest-api/ – 2013-04-12 13:07:57
明白了,如果輸入數據具有相同的UserID和ItemID,則強度會遞增而不是替換!並且我再次提出問題,如果我使用相同的inputDir重新啓動Myrrix,那麼inputDir中的相同csv數據將被再次讀取還是增加舊值還是忽略? – piaolingxue 2013-04-15 01:25:21