2013-04-01 94 views
1

我正在尋找一個旨在處理樹結構化數據的數據庫。我研究過Neo4j,它很好,但它並不真正支持分片。另一方面,Couchbase並不是真正爲單一數據樹構建的(根據我的理解)。樹狀結構化數據的分佈式數據庫?

數據樹理論上很容易在服務器之間進行拆分,而完整的圖形則不然。我不需要完整圖的好處,因爲我需要動態分割大數據集的能力。完整的數據集不適合單個服務器。

的功能,我需要的(解釋,就好像它是一個正常的計算機文件系統):

  1. 在一些「文件夾」排除「子文件夾」
  2. 拆分數據庫(和負載選擇每個節點)在冗餘服務器之間

系統負載將大部分讀取(大約90%)。

謝謝!

+0

有多大規模數據集?在需要它之前,你可能會過早地優化你的代碼。你有什麼想法可以拆分?你說樹已經成熟分解了,但是你能否詳細說明一下,因爲我可以看到許多樹具有與圖分割相同的問題。 – Nicholas

+0

http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/查看泰坦。圖形數據庫按比例縮放 - 甚至碎片。 – ryan1234

+0

@Nicholas它將大約1GB-100TB,但我希望它可以一路擴展。我可以在任何「文件夾級別」進行分割,即將一半的「文件夾」放在一臺服務器上,另一半放在另一臺服務器上,對不對? –

回答

0

我評論,因爲我想嘗試和幫助,並沒有想到我的鏈接是真正的答案值得。 =)

我一直密切關注泰坦,它現在似乎是非常流血的邊緣。在閱讀文章(http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/)之後,他們似乎在某種程度上使用了Cassandra,所以Cassandra的規模與泰坦的規模密切相關。

從文章看來,你不必顯式分解數據。當它達到一定的尺寸時它會自動分配給你。

這裏是關於泰坦另一個演示以及它如何使用卡桑德拉:http://blog.andreamostosi.name/2013/03/titan-distributed-graph-database/

+0

使用最新解決方案有哪些風險? –

+0

如果我是你,我會立即聯繫到泰坦的傢伙,並建立關係。如果你從不與他們交談,那麼你冒着某種錯誤的風險,並且沒有任何支持/不知道發生了什麼。風險在於你會寫出一大堆反對泰坦的代碼,並且它會變得不可用或變得無法使用。 Neo4j有其背後的歷史,但泰坦可能是下一個最好的。這可能看起來像一個警察,但這些日子裏很多最新鮮的東西都在Twitter上。按照@aureliusgraphs並問他們的問題。我敢打賭他們回答! – ryan1234

+0

@aureliusgraphs仍然沒有迴應。由於它基於cassandra,它是否和cassandra具有相同的限制?而且,cassandra如何知道要在哪臺服務器上存儲什麼,以儘量減少跨服務器的圖遍歷? –