2013-10-18 126 views
3

我想通過Pig加載數據&將它加工成HBase。 我已經將文本文件加載到HDFS。 然後我在豬身上使用了下面的命令。如何使用Pig加載數據在hbase中使用Pig

A = LOAD '/tmp/hive-Vijay.Shinde/file.txt' USING PigStorage(',') 
as (strdata1:chararray, strdata2:int); 

然後我使用的,

STORE A INTO 'mydata' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('mycf:strdata2'); 

MYDATA是在HBase的表。

它提供了錯誤:Unhandled internal error

回答

1
  1. 嘗試註冊在你的豬文件中的HBase的罐子。例如。註冊 /home/hadoop/lib/hbase-0.92.0.jar
  2. 請確保您在 插入數據之前創建了具有列族的hbase表。
  3. 還提到hadoop,豬和hbase的版本。
  4. 你也可以通過網頁界面查看你的調試日誌。 如果您在本地運行羣集,請使用localhost/jobtracker.jsp

    這會爲您提供有關作業的更多有用日誌信息 。

0

這種說法可能的工作:

STORE A into 'hbase://table_name' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('cf1:*');