2013-05-30 34 views
1

我剛開始使用mahout,並且正在考慮從現有數據構建推薦引擎。在我目前的表中的數據存儲格式類似將數據從我的表格轉換爲mahout datamodel

userId From  TO  Meal Carrier   Travel type 

MT001 London Abu Dhabi Non-Veg Lufthansa   International 
MT001 Abu Dhabi Beijing Veg  Lufthansa   International 
MT001 New York Chicago Non-Veg American Airlines Domestic 
MT002 New York Texas  Veg  American Airlines Domestic 

現在我想這個數據集轉換到由象夫接受的數據模型。我知道,象夫數據模型格式是這樣

用戶ID(INT)的itemId(INT),優先值(浮點)

任何人都可以請建議我如何轉換上面設置我的旅行數據(其中包括比mohout數據模型更多的列和不同的數據類型)到mahout支持的數據模型。任何幫助將不勝感激。

回答

1

我想你必須重寫你的數據模型類,嘗試擴展和重寫AbstractDataModel類,你也可以嘗試使用框架中提供的IDMigrator控件來將你的字符串轉換爲整數值。

通過該主題 - Mahout : To read a custom input file

相關問題