0
當使用如何使用Hbase的RowCounter類獲取表中的行數?
$ hbase org.apache.hadoop.hbase.mapreduce.RowCounter <tablename>
我怎麼指定的MapReduce集羣使用我指定的表數行(每this link從hbase.apache網站)。
我在我的cmd行上運行了上面的命令,它返回了返回的行數。但是,它需要2個多小時才能返回計數,因爲它在本地主機上運行,而不是在hadoop羣集上運行。我花了10分鐘,從使用HBase的shell中運行:
count 'tablename'
之前有人問,爲什麼我就不能運行在HBase的外殼這個CMD,我有一個用了1個小時,返回行數的表。我認爲使用這個命令會更快,因爲它會使用mapreduce作業返回行計數,而不是在hbase shell中運行,我不認爲它使用mapreduce。
運行'''$ hbase org.apache.hadoop.hbase.mapreduce.RowCounter'''也很慢?您不需要指定MapReduce集羣,我認爲該作業在hbase regionservers上運行。 –
@ sel-fish,thx爲您提供幫助。我可能會關閉這個問題。我發現我的用戶沒有權限寫/使用集羣,這就是爲什麼它可能使用本地主機。一旦我找到有權訪問集羣的用戶,上述命令花費15秒運行,而hbase shell運行10分鐘。 – Classified