2011-12-13 99 views
2

我想構建一個跨越多節點的B +樹計算機網絡(Linux PC的內部子網)
彈性海量存儲。範圍掃描很重要。分佈式網絡B +樹

這是否基本上是
分佈式數據庫系統的底層數據結構? (Cassandra,HBase)

有沒有關於分佈式B +樹的研究?
我看到這篇文章在
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
但跳過B樹只取故障節點出來(所以有數據丟失)

我在B +樹有特別感興趣內置冗餘
(即,如果一主機發生故障時,所有的節點是主機處於脫機狀態,
我想另一個複製的主機成爲主節點
服務器,並採取故障主機的地方)

我不想使用集合的DB插件對於大規模存儲系統(跨商品
x86,帶有FOSS OS的x64硬件),分片並不是一個好選擇
(1節點,一個DB)

我重新發明了車輪嗎?
我應該只使用Cassandra或HBase?

回答

2

Cassandra支持範圍查詢。

當您打開機器時,Google的Big Table會自動將新機器添加到羣集。這是非常有彈性,容易添加更多的機器。不幸的是,它的速度有一個缺點:查詢非常有限。你可以做一些範圍查詢。請參見本文列表和更多的細節:http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

一個很好的例子數據是如何存儲在大表:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

一個不錯的堆棧溢出後: storing massive ordered time series data in bigtable derivatives