好吧,我一直在尋找解釋一段時間,但仍然找不到答案。卡桑德拉索引解釋
當我們談論卡桑德拉指數,我得到了要點,其上的是:
- 做高或非常低的基數數據未使用
在低基數我明白了 - 搜索時我們會得到很寬的行。
但是,在高基數數據的幕後發生了什麼?所有的書籍和博客似乎都複製了datastax的例子,它沒有解釋爲什麼,只是告訴你不要這樣做。
假設我想在用戶電子郵件上創建一個索引。如果我理解正確的,當我搜索用戶通過電子郵件,兩件事情將會發生:
- 要求所有節點,其中一個具有通過用戶ID 從正確的分區與此相關的電子郵件
- 獲得用戶的用戶ID
如果我在用戶國家(這似乎是更合適的字段)創建索引,算法應該是相同的。
因此,請解釋我從理解爲什麼在高基數數據上使用索引時錯過了什麼。
另外,關於相關主題:有沒有一種情況,當索引比物化視圖更優先?