2014-07-07 46 views
0

我是mahout的新手,我使用並行工作here創建了隱式反饋推薦器。我的數據集的每一行都包含user_id,product_id,preference_score(這是用戶對產品的訪問次數)。用戶和產品ID是長類型的。過濾掉單次或雙次訪問後,我有一百萬個這類數據點。隱式反饋建議 - 錯誤結果

我基本上寫了一個bash腳本,它運行兩個作業「parallelALS」和「recommendfactorized」,就像示例中的「factorize-movielens-1M」所示。運行該腳本後,得到的建議似乎有一個錯誤。每行結果的格式(如多篇博客文章中所述)似乎爲: -
user_id [product_id:score,...]

但是,每行中的所有products_ids都是0.我不確定是什麼這裏錯了。這是數據集的問題還是調整參數(alpha,lambda等)或其他問題?

+0

發佈您的數據示例。用戶和項目的ID必須是Mahout ID,這意味着連續的整數。您需要維護字典以將用戶和項目ID映射到Mahout ID(以及兩個HashBiMaps將工作或數據庫),這是新用戶經常錯過的事情。 – pferrel

回答

0

用戶和項目的ID必須是Mahout ID,這意味着連續的整數。您需要維護字典以將用戶和項目ID映射到Mahout ID(以及兩個HashBiMaps將工作或數據庫),這是新用戶經常錯過的事情。

爲了確保發佈您的輸入數據的示例。