2013-05-30 122 views
1

我有一個航空公司旅行社的用戶數據,從這個數據我想獲得用戶的某些實體的最偏愛的價值。我的數據集的格式爲喜歡 -根據用戶數據獲取偏好

userId From  TO  Meal Carrier   Travel type 

MT001 London Abu Dhabi Non Veg Lufthansa   International 
MT001 Abu Dhabi Beijing Veg  Lufthansa   International 
MT001 New York Chicago Non Veg American Airlines Domestic 
MT002 New York Texas  Veg  American Airlines Domestic 

現在我想獲得用戶MT001的膳食,載列的優選值與該用戶進行分類。我知道我們可以使用SQL來獲取這些值,但使用mahout框架可以做到這一點嗎?我不想實時得到結果,我正在考慮像預處理數據並將結果存儲在可以立即獲取結果的地方的批處理作業。

我知道mahout支持分類,並且我們可以使用諸如基於項目的推薦之類的東西來獲得首選值。此外,我正計劃轉移到hadoop,那麼在這種情況下選擇mahout會有多好。

回答

1

我認爲你在這裏尋找的東西就像基於內容的推薦,Mahout支持基於內容的推薦,但我不確定它是否是實現它的最佳框架,你將不得不重寫一個地獄很多的類根據你的程序工作。

找到了 - Extend Mahout for new dataset