我開始使用Cassandra(我是新來的)開發一個項目,並且正在開發一個模式。我有一個問題,那就是I/O的含義是否有一行包含其中的數百萬列,特別是關於寫入的內容?在Cassandra中使用非常寬的行時I/O含義
爲了明確我想要做什麼,我基本上想跟蹤IP所屬的域。我認爲這樣做的一種方式是使用像「google.com」這樣的rowkeys,並且該行內的每一列都是屬於該域的IP地址。有人告訴我,如果你的列很寬,而且你改變它,那麼它會創建大量的I/O b/c,它必須在整個數據不可變的某個時間點將整個行重新寫入磁盤。它是否正確?我認爲Cassandra只會將更改後的數據以及更改後的數據寫入提交日誌和memtable。然後,當數據被刷新並進行壓縮時,它會將數據合併到列系列的新SSTable中。
感謝您的信息! – 2012-02-27 13:47:41