2012-06-23 82 views
2

我想將基於Hadoop的Mahout推薦器與Apache Hive結合使用。因此,我生成的建議書直接存儲在我的Hive表格中......任何人都知道類似的教程。Mahout Hive集成

回答

7

基於Hadoop的Mahout推薦器可以直接在HDFS中存儲結果。

Hive還允許您使用CREATE EXTERNAL TABLE recommend_table在任何數據之上創建表格架構,該架構還指定數據的位置(LOCATION '/home/admin/userdata';)。

通過這種方式,您可以確保在將新數據寫入該位置時 - /home/admin/userdata那麼它已經可用於Hive,並且可以通過現有的Table模式:recommendation_table查詢。

我曾經在一段時間內對它進行了博客:external-tables-in-hive-are-handy。此解決方案有助於任何類型的map-reduce程序輸出,需要立即爲Hive特設查詢提供。

+0

如果我想通過從Hive讀取數據目錄(即通過HQL)執行Mahout分析,那麼該怎麼辦?我所有的表都是外部表格。謝謝。 – Kevin