你好,我們有一個表在卡桑德拉,其結構如下混淆了數據模型卡桑德拉
CREATE TABLE dmp.user_profiles_6 (
vuid text PRIMARY KEY,
brand_model text,
first_seen timestamp,
last_seen timestamp,
total_day_count int,
total_usage_count int,
user_type text
) WITH bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.LeveledCompactionStrategy'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.1
AND speculative_retry = '99PERCENTILE';
我在卡桑德拉從datastax瞭解數據建模的幾篇文章。其中表示主鍵由分區鍵和集羣鍵組成。
現在在上面的例子中,我們有一個vuid列,它是每個唯一用戶的標識符。這是主要關鍵。我們有400M獨特的用戶。那麼現在是否意味着Cassandra正在生產400M分區?然後,這必須降低性能。在一篇關於數據建模的datastax文章中,一個示例表顯示了uuid列上的主鍵,這個列是唯一的,並且具有很高的基數。我完全困惑,任何人都可以幫助我確定哪個列可以設置爲分區密鑰,哪個是集羣密鑰?
查詢可以是如下: 1.選擇直接記錄上的可見或第一次看到
感謝您的輸入。請參考我添加了可能的查詢所需的問題 – Shades88