2017-07-25 71 views
0

我試圖用Importtsv加載csv文件到HBase的。加載csv文件到HBase的使用Importtsv

我已經上傳了customers1.csv到HDFS,創建了一個名爲T1一個HBase的表使用命令

hbase(main):001:0> create 't1','FirstName','LastName' 

,當我嘗試通過運行命令加載CSV數據到HBase的表t1:

hbase(main):010:0> hbase org.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.com/user/maapr/test/customers1.csv 

我無法加載由於數據:

SyntaxError: (hbase):10: syntax error, unexpected tIDENTIFIER 

我跟着從水庫的語法在線搜索,但我仍然有這個語法錯誤。任何想法是怎麼回事?您的解決方案將非常感激。

而另一個愚蠢的問題。有沒有其他辦法從HDFS的數據加載到HBase的除了Importtsv?謝謝。

回答

0

正在運行從HBase的批量加載命令殼。走出HBase的外殼,並嘗試..需要在這部分:)

空間:ImportTsv -Dimporttsv.separator =「」

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.comser/maapr/test/customers1.csv 

對於批量加載,你也可以寫一個定製MR工作。 我使用阿帕奇鳳凰批量加載工具我的鳳凰HBase的表。

+0

和我們需要什麼樣'-Dimporttsv.columns ='寫的時候,我們不知道有至少150列? – Marine1