當您使用OrderPreservingPartitioner和列家族關鍵字(例如表示YYYYMMDD的int)時,您將在寫入時獲得熱點,並且大部分加載將擊中cassandra環中的一個/兩個節點。如果使用RandomPartitioner,當使用不頻繁變化的密鑰(即YYYYMMDD)時,cassandra會傳播負載嗎?當使用Cassandra的RandomPartitioner時的關鍵選擇
簡而言之,RandomPartitioner是否將負載分散在一小部分不經常更改的鍵值上?
Partirioner選擇密鑰空間還是集羣級別設置?
注意:所以如果你md5 20110902你得到59b7841383176e942495550ecc801a9e。如果我用密鑰20110902(即59b7841383176e942495550ecc801a9e)重複加載數據,那麼不僅僅將數據分配給具有分配給它的59b78413 ....的單個節點。是否還有別的Cassandra正在做的傳播負載
所以,如果你md5 20110902你得到59b7841383176e942495550ecc801a9e。如果我用密鑰20110902(即59b7841383176e942495550ecc801a9e)重複加載數據,那麼不僅僅將數據分配給具有分配給它的59b78413 ....的單個節點。 Cassandra還在做其他事情來分散負載 –
行按鍵分區,因此One Big Row將是一個反模式。 – jbellis