1
我有一個航空公司旅行社的用戶數據,從這個數據我想獲得用戶的某些實體的最偏愛的價值。我的數據集的格式爲喜歡 -根據用戶數據獲取偏好
userId From TO Meal Carrier Travel type
MT001 London Abu Dhabi Non Veg Lufthansa International
MT001 Abu Dhabi Beijing Veg Lufthansa International
MT001 New York Chicago Non Veg American Airlines Domestic
MT002 New York Texas Veg American Airlines Domestic
現在我想獲得用戶MT001的膳食,載列的優選值與該用戶進行分類。我知道我們可以使用SQL來獲取這些值,但使用mahout框架可以做到這一點嗎?我不想實時得到結果,我正在考慮像預處理數據並將結果存儲在可以立即獲取結果的地方的批處理作業。
我知道mahout支持分類,並且我們可以使用諸如基於項目的推薦之類的東西來獲得首選值。此外,我正計劃轉移到hadoop,那麼在這種情況下選擇mahout會有多好。