3
我見過的建議的兩種矛盾的作品,當談到在HBase的設計行ID,(特別是,但我認爲它適用於卡桑德拉爲好。)面向列的數據庫中的順序行ID(HBase,Cassandra)?
- ,你會被聚集在一起的鍵組經常要利用數據局部性。 (白,Hadoop的權威指南。我記得看到它在HBase的網站,但無法找到它...)左右
- 傳播鍵,以便工作可以在多臺機器分佈(Twitter, Pig, and HBase at Twitter幻燈片14)
我猜哪一個是最優的可以取決於你的用例,但是沒有人有任何一種策略的經驗嗎?