1
我們正在評估是否可以從SQL SERVER遷移到cassandra for OLAP。根據內部存儲結構,我們可以有寬行。我們幾乎需要在日期之前訪問數據。我們經常需要在日期範圍內訪問數據,因爲我們有財務數據。如果我們使用日期作爲分區鍵來支持按日期過濾,我們最終會減少具有大量列的行。 當我們每天處理數百萬筆交易時,如果我們將來有單列行密鑰有數百萬列,會不會妨礙性能?Cassandra性能:列數越少列數越少,列數越少列數越多
我們是否需要對訪問模式進行一些更改,以使每行的列數更少且行數更多。
需要一些有識之士表現在兩個方向上
感謝您的評論。達到20億列的上限是不太可能的。寬行不適合特定的磁盤可能是這種情況。 cassandra不處理這種行不適合磁盤的情況。它應該將數據傳輸到另一個節點,因爲選擇節點來保存該行是內部存儲引擎的決定。 – 107
Cassandra中的數據分區由分區鍵驅動:使用簡單快速的哈希算法Cassandra標識包含數據的節點。在這方面,寬行是一個單位,它不在節點之間分裂。最終嘗試將其他字段引入分區鍵(例如,金融產品的ID,年份或甚至月份,如果有意義的話)。 – medvekoma
如果散列算法識別最初不適合或適合行的節點,但隨着寬行最終增長,cassandra會將該行轉移到某個其他機器嗎? – 107