2014-03-28 38 views
1

有沒有任何方法可以使用Hbase表作爲Hadoop流作業的源代碼?具體來說,我想運行用Python編寫的Hadoop流作業。當輸入被指定爲HDFS上的一個文件夾時,這很有效。但我一直無法找到任何有關從Hbase表讀取數據的文檔。如何使用hbase作爲hadoop流作業的源代碼

這是支持嗎?或者我將不得不經歷編寫一個Java代碼,以便首先從Hbase獲取數據到HDFS,然後運行流式作業?

我使用Cloudera的Hbase 0.94。

(還有一個類似的問題already present here。但它指向的第三方解決方案,沒有積極貢獻,我希望這將在Hbase支持)。

回答

相關問題