我需要編寫一個MapReduce作業,它獲取給定日期範圍(比如最後一個月)的所有行。如果My Row Key以Date開頭,那本來就是一個Cakewalk。但我頻繁的Hbase查詢是關鍵的初始值。如何有效地掃描HBase行
My Row key is exactly A | B | C | 20120121 | D。 A/B/C和日期(以YearMonthDay格式)結合使用的唯一行ID。
我的Hbase表格可能有高達幾百萬行。我的Mapper是否應該讀取所有表格,並且如果每個行都落在給定的日期範圍內,可以對每行進行過濾或者掃描/過濾器可以幫助處理這種情況?
有人可能會建議(或代碼片段)以有效的方式處理這種情況?
感謝 -Panks
爲什麼不把表格的內容複製到新的,重新排列鍵並廢棄舊錶格? – Mario
@Mario如果桌子上有萬億個按鍵,該怎麼辦?他需要經常這樣做嗎? – markg