2014-10-12 62 views
1

我們試圖爲我們的交易系統建立數據倉庫。
- 我們每天進行5000-6000次交易,他們可以超過20,000。
- 每個交易產生一個文件,大小(> 4MB)實時查詢 - 最適合的HBase或Cassandra?

我們希望有一個系統,它可以對現有數據進行更新,保持一致性和可用性,並具有良好的讀取性能。基礎設施不是問題。

Hbase或cassandra或其他?您的幫助和指導受到高度讚賞。

非常感謝!

回答

0

大多數較新的nosql平臺可以在性能方面做你所需要的 - hbase和cassandra都可以水平縮放(也可以是Aerospike等),因此如果數據模型尊重數據的「產品模式」分配。

我不會選擇性能方面的技術。 我會做的是:

  1. 由一堆產品提供再考慮一個,開箱即用,最適合我的需要
  2. 操作的列表,我需要不同功能的列表做數據和檢查,如果我不打算「」某些特定產品

雖然1是很容易做到的2需要深厚的產品分析。例如,你說你需要更新現有的數據 - 讓我們想象你選擇了Cassandra,並且非常頻繁地更新了一個列,在該列上放置了用於搜索目的的二級索引(即在底層創建了查找表)。任何時候在查找表上對此列執行更新時,都會執行刪除和插入操作。您可以在article中看到,在Cassandra中執行許多刪除操作被認爲是反模式,並且可能導致出現問題的情況。這只是我在Cassandra上做的一個例子,因爲它是我在nosql產品中最瞭解的一個例子,而不是告訴您避開Cassandra。

+0

謝謝卡羅!你對Hbase有任何想法嗎?我聽說如果我們存儲的文件大小小於hfds默認大小,那麼性能會有所下降,這是真的嗎? – 2014-10-12 09:11:47

+0

我真的不知道,但這正是我在選擇產品之前檢查一切時的意思 – 2014-10-12 09:27:17

相關問題