hbasestorage

    1熱度

    2回答

    如何爲豬腳本定製HbaseStorage?實際上,我想在將數據加載到豬腳本之前對數據執行一些業務邏輯。這將是像HbaseStorage之上的自定義存儲。 例如,我的行密鑰具有像這樣的結構A_B_C。目前,我在豬腳本中將HbaseStorage中的A_B_C關鍵字傳遞給我,但是我想在將輸入數據提供給實際豬腳本之前執行一些邏輯,例如針對諸如A_B_C_D之類的關鍵字進行過濾等操作。這怎麼可能

    0熱度

    2回答

    如果我使用hbase shell和問題: put 'test', 'rowkey1','cf:foo', 'bar' scan 'test' 我會看到的結果作爲一個字符串,而不是字節。 如果我使用happybase和問題: import happybase connection = happybase.Connection('<hostname>') table = connection

    0熱度

    1回答

    我想將一些HDFS數據導入到已經存在的HBase表中。 我創建的表格是使用2列系列創建的,並且在創建新表格時使用了HBase附帶的所有默認設置。 表格已經填滿了大量的數據,並且有98個在線區域。 它具有的行鍵類型是(簡化版): 2-CHARS_ID + 6-DIGIT-NUMBER + 3 X 32-CHAR-MD5-HASH。 鍵示例:IP281113ec46d86301568200d510f4

    0熱度

    1回答

    當我添加重複條目到HBASE表時會發生什麼情況。碰巧看到更新的時間戳列。 hbase中是否有屬性可以選擇在添加到表格時避免/允許覆蓋?

    0熱度

    1回答

    我正嘗試使用Java API在本地計算機中填充單節點Titan-HBase。 當試圖在土衛六建邊參數與HBase的後端,使用下面的代碼, public static final String ELABEL_RESOURCE_HAS_XDOC = "_EResourceHasXDoc"; public static final String IDX_EDGE_BY_CID_XID = "IdxEd

    3熱度

    1回答

    我知道HBase中一行的不同列可以使用Put來更新。我正在使用Pig + HBase和HBaseStorage。我能夠存儲並加載HBase,而Pig表達式中沒有任何關鍵字存在的問題。但是,當我開始嘗試使用存在密鑰的HBaseStorage()來更新表時,工作失敗。 是否有人可以澄清HBaseStorage是否只能用於存儲新記錄或更新現有記錄中的列。 在此先感謝。

    0熱度

    1回答

    我在我的學術項目的單個節點上運行hbase(0.94.13)。在將數據加載到hbase表格後,我試圖使用HBaseStorage在數據上運行pig(0.11.1)腳本。然而,這將引發一個錯誤,說 拋出:IllegalArgumentException:不是主機:端口對:\ 00 \ 00 \ 00 這裏負載命令我使用的是豬 books = LOAD'hbase:// booksdb'使用 org.

    2熱度

    1回答

    有沒有人有過使用HBaseStorage通過Pig在Dataproc上從Bigtable載入數據的經驗或成功? 這是我試圖運行的一個非常簡單的Pig腳本。它會失敗,並顯示無法找到BigtableConnection類的錯誤,我想知道我可能會錯過哪些設置以成功從Bigtable加載數據。 raw = LOAD 'hbase://my_hbase_table' USING org.apac

    2熱度

    1回答

    我想使用匹配某種模式的行從HBase shell中掃描HTable中的行。 例如,我有以下表中的數據: row:r1_t1 column:cf:a, timestamp=1461911995948,value=v1 row:r2_t2 column:cf:a, timestamp=1461911995949,value=v2 row:s1_t1 column:cf:a, tim