0

感謝您對我的問題感興趣。在開始之前,我想讓你知道我對Hadoop & HBase非常陌生。到目前爲止,我發現Hadoop非常有趣,並希望在未來貢獻更多。如何將鍵值數據加載到HBase表中?

我主要對提高HBase的性能感興趣。要做到這一點,我已經創建了一個HBase的表,寫了豬腳本加載5000的數據線(只值由「!」分隔)到HBase的表,後來我映射了該^ h基表與蜂巢表。每一件事情是工作的罰款截至目前...但是問題就來了,現在是我要加載具有關鍵的數據和值兩者(例如鍵1 = 12 !鍵2 = 13),因此對於什麼樣的解析我可以選擇將相應的鍵值對數據加載到h基表中,也請讓我知道h基表中行鍵的重要性。

,我不得不寫的豬腳本如下

A = LOAD '/ BULK_ARK_DATA /' 使用PigStorage( '!')AS(ID:chararray,一:chararray,B:chararray,C:chararray ); STORE甲INTO 'HBase的:// bulk_ark' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage( 'AF:一個AF:乙AF:C');

因此,如何加載HBase的表中的關鍵值數據??????請回復我早u得到這個.... :)

回答

0

HBase的實際上是一個鍵值數據存儲(地圖爲核心)。你不必做任何特別的事情,但是想一想你的表模式。對於你的具體情況,如何讓你的第一部分數據爲關鍵,第二部分爲價值。類似「CF:鍵1 => 12」

+0

感謝名單塔裏克:)是的,我同意你的看法,但有一個疑問在這裏,如果我在各佈線變得不同不同的鍵值,在這種情況下,如何寫一個選擇查詢特定值?讓我來詳細解釋一下例子File test.ark包含1)key = 12! name = test 2)value = 14!id = 345 3)true = yes現在,如果我們想爲「id」寫qury,那麼如何爲「id」寫查詢?如果你沒有意識到id key只有第二行的內容。來自我方的道歉如果實際視圖 – MapReddy

+0

錯誤,您可以使用列限定符過濾器並直接從所有行中獲取「id」列,無論它出現在哪裏。 – Tariq