我必須每月在HBase表中存儲有關實體的信息。我想處理迄今爲止使用mapreduce邏輯的實體的所有月份詳細信息。我很困惑是否選擇HBase桌子的高窄或寬扁設計。HBase表格設計 - 高窄窄平坦的方法
使用扁平寬方法,實體Id將保留爲行鍵和月份id作爲列限定符,並且詳細信息爲限定符值。在HBase-mapreduce中,我可以獲取地圖和過程中實體的所有詳細信息。
高窄方法將存儲行鍵作爲實體ID和月份的組合。此外,細節將存儲在一個單獨的列中。在HBase-mapreduce中,我必須獲取詳細信息,以便在縮減器中查找map和aggregate中的所有月份。
哪種方法更好,性能更好?提前致謝。
所以你必須在一個月內存儲一次信息??另外,鋤頭多? – Tariq
信息粒度是每月。可能發生的情況是,一個實體的特定月度信息可以更新頻率更高。要存儲的信息包含500個鍵值。可能有數百萬個這樣的實體。我沒有確切的數字數據。 – InfamousCoconut