2013-05-06 67 views
1

我正在使用Apache Mahout針對推薦系統的基於用戶的協作過濾。我可以定義我自己的方法來計算Mahout協作過濾中的UserSimilarity嗎?

我有兩個問題。

1)UserID和ItemID必須是數字嗎?

我的數據模型看起來像這樣:

jessestay,E/4d0b55757114464eb56cdf01bf5d6842,1

其中 「jessestay」 是用戶ID, 「E/4d0b55757114464eb56cdf01bf5d6842」 是ITEMID, 「1」 是從用戶到優先級值這個項目。

我怎樣才能將用戶ID和ItemID編碼爲int或long? 2)當我使用UserSimilarity時,我是否必須使用建立的歐幾里得距離,皮爾遜相關係數或Spearman相關?

我可以定義我自己的方法來估計userSimilarity嗎?

這是我第一次使用Apache Mahout的協作過濾。

非常感謝您的幫助。 期待您的回覆!

xiao shen

回答

0

是的,用戶和物品ID必須是數字。只要把你的價值觀湊成長整。唯一的問題是你必須記住映射返回到字符串。如果您也有數字標識,最好使用它們。

是的,只是實現UserSimilarity來定義你想要的任何相似性。

相關問題