2011-05-28 79 views
1

我試圖抓住卡桑德拉和關係數據庫之間的一些性能差異。Cassandra的寫入性能VS Releational數據庫

從我已閱讀,Cassandra的寫入性能,無論數據量保持不變。通過寫入性能,我假設這意味着要添加新行以及在關鍵匹配中替換現有行(如關係世界中的更新)。這個假設是否正確?

而且,從我的理解對關係型數據庫的更新變慢時,表/分區變得更大。這是因爲必須執行全表掃描來查找行,或者需要執行索引查找,並且隨着表或分區的增長,這兩件事情都需要更長的時間。所以根據表/分區的數據量更新永久更長?

當新的數據插入到關係數據庫,我知道任何索引需要有新的數據,但沒有涉及到正確查找?那麼隨着數據量的增加或者與關係數據庫保持不變,插入也會變得更加慢速?

感謝您的任何提示

回答

4

如果表的索引,他們會越來越慢。不僅必須寫入數據,還必須更新索引。插入沒有索引的表格沒有約束是閃電般的,因爲不需要進行檢查。記錄可以寫在表空間的末尾。

1

在關係數據庫方面,我一直在做我們的RDBMS負載測試在那裏我可以看到,作爲數據添加到數據庫的性能呈指數下降。 RDBMS performace test

我仍在研究Cassandra設置,以便能夠實現可比較的測試。在此期間,該卡珊德拉演示給出卡桑德拉一些信息相比,MySQL的: http://www.slideshare.net/Eweaver/cassandra-presentation-at-nosql