我們試圖爲我們的交易系統建立數據倉庫。
- 我們每天進行5000-6000次交易,他們可以超過20,000。
- 每個交易產生一個文件,大小(> 4MB)實時查詢 - 最適合的HBase或Cassandra?
我們希望有一個系統,它可以對現有數據進行更新,保持一致性和可用性,並具有良好的讀取性能。基礎設施不是問題。
Hbase或cassandra或其他?您的幫助和指導受到高度讚賞。
非常感謝!
我們試圖爲我們的交易系統建立數據倉庫。
- 我們每天進行5000-6000次交易,他們可以超過20,000。
- 每個交易產生一個文件,大小(> 4MB)實時查詢 - 最適合的HBase或Cassandra?
我們希望有一個系統,它可以對現有數據進行更新,保持一致性和可用性,並具有良好的讀取性能。基礎設施不是問題。
Hbase或cassandra或其他?您的幫助和指導受到高度讚賞。
非常感謝!
大多數較新的nosql平臺可以在性能方面做你所需要的 - hbase和cassandra都可以水平縮放(也可以是Aerospike等),因此如果數據模型尊重數據的「產品模式」分配。
我不會選擇性能方面的技術。 我會做的是:
雖然1是很容易做到的2需要深厚的產品分析。例如,你說你需要更新現有的數據 - 讓我們想象你選擇了Cassandra,並且非常頻繁地更新了一個列,在該列上放置了用於搜索目的的二級索引(即在底層創建了查找表)。任何時候在查找表上對此列執行更新時,都會執行刪除和插入操作。您可以在article中看到,在Cassandra中執行許多刪除操作被認爲是反模式,並且可能導致出現問題的情況。這只是我在Cassandra上做的一個例子,因爲它是我在nosql產品中最瞭解的一個例子,而不是告訴您避開Cassandra。
謝謝卡羅!你對Hbase有任何想法嗎?我聽說如果我們存儲的文件大小小於hfds默認大小,那麼性能會有所下降,這是真的嗎? – 2014-10-12 09:11:47
我真的不知道,但這正是我在選擇產品之前檢查一切時的意思 – 2014-10-12 09:27:17