2016-01-26 48 views
0

我在Hbase有一個很大的列,比如:columnfamilyName:sampleRaw。列sampleRaw的數據大小可能是20MB,甚至每行大50MB。現在我想要統計表中有多少行sampleRaw。命令count不正確,它不知道該行是否有列sampleRaw。命令scan太慢,因爲它試圖打印出列sampleRaw,而它非常大。Hbase如何計算非常大的列

例如,我想這個命令:

scan 'bigRaw',{COLUMNS=>['rawf':'sample']} 
+0

你能粘貼你的代碼嗎? –

+0

我沒有編寫代碼,我只是使用scan'bigRaw',{COLUMNS => ['rawf':'sample']}但列太大而無法掃描,屏幕會在一段時間後崩潰。 – Jack

回答

1

如果你可以使用Java客戶端,您可以嘗試在柱基as you can see here KeyOnlyFilter這樣的數據不會傳輸到您通過網絡,這將是快shell「count」命令。