我正在使用Apache Mahout針對推薦系統的基於用戶的協作過濾。我可以定義我自己的方法來計算Mahout協作過濾中的UserSimilarity嗎?
我有兩個問題。
1)UserID和ItemID必須是數字嗎?
我的數據模型看起來像這樣:
jessestay,E/4d0b55757114464eb56cdf01bf5d6842,1
其中 「jessestay」 是用戶ID, 「E/4d0b55757114464eb56cdf01bf5d6842」 是ITEMID, 「1」 是從用戶到優先級值這個項目。
我怎樣才能將用戶ID和ItemID編碼爲int或long? 2)當我使用UserSimilarity時,我是否必須使用建立的歐幾里得距離,皮爾遜相關係數或Spearman相關?
我可以定義我自己的方法來估計userSimilarity嗎?
這是我第一次使用Apache Mahout的協作過濾。
非常感謝您的幫助。 期待您的回覆!
xiao shen