2015-09-15 18 views
0

我必須從HIVE加載數據到HBase表中。 我知道,有多種方法可以做到這一點,例如:我應該使用PIG將數據從HIVE加載到HBase中,還是有更好的方法?

  • 從HIVE生成CSV,然後使用批量加載加載數據將其轉換爲HFILE
  • 使用MapReduce的產生HFILE
  • 使用PIG腳本生成並加載HFile
  • 或者是否有直接轉換器可用?

你能指導我推薦最好的方法嗎?

我們並沒有在這個用例中使用phoenix。

回答

1

您可以使用HBASE integration

CREATE TABLE hbase_table_1(key int, value string) 
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' 
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val") 
TBLPROPERTIES ("hbase.table.name" = "xyz"); 

那麼你的數據加載到蜂巢表,也將載入HBase的,因爲是同一個表。

+0

此SERDE是Hive分配的一部分嗎? –

+0

這是,請參閱https://github.com/apache/hive/tree/b099e5b9c1a40bf7aac686cc88803eeb888ac76c/hbase-handler.The jar必須被添加到classpath,閱讀鏈接的文檔。 –

+0

非常感謝您使用您提供的解決方案將數據加載到HBase的解決方案。 此解決方案是否有任何限制? –

相關問題