我正在做一個涉及構建和查詢Cassandra數據集羣的學生項目。Cassandra超時cqlsh查詢大量(ish)數據量
當我的羣集負載很輕時(大約30GB),我的查詢運行沒有問題,但現在它有點大(1/2TB),我的查詢超時。
我認爲這個問題可能會出現,所以我纔開始生成和負載測試數據我已經在我的cassandra.yaml文件改變了這個值:
request_timeout_in_ms (默認值:10000)爲默認的超時其他,雜項操作。
但是,當我將該值更改爲1000000時,cassandra似乎在啓動時掛起 - 但這可能只是工作中的大暫停。
我的數據生成目標是2TB。如何查詢大量空間而不會超時?
查詢:
SELECT huntpilotdn
FROM project.t1
WHERE (currentroutingreason, orignodeid, origspan,
origvideocap_bandwidth, datetimeorigination)
> (1,1,1,1,1)
AND (currentroutingreason, orignodeid, origspan,
origvideocap_bandwidth, datetimeorigination)
< (1000,1000,1000,1000,1000)
LIMIT 10000
ALLOW FILTERING;
SELECT destcause_location, destipaddr
FROM project.t2
WHERE datetimeorigination = 110
AND num >= 11612484378506
AND num <= 45880092667983
LIMIT 10000;
SELECT origdevicename, duration
FROM project.t3
WHERE destdevicename IN ('a','f', 'g')
LIMIT 10000
ALLOW FILTERING;
我有同樣的模式演示密鑰空間,但遠小於數據大小(10GB〜),這些查詢運行在鍵空間就好了。
所有這些查詢表都有數百萬行和每行約30列。
您可以發佈您的查詢的例子嗎? – Aaron 2015-04-03 19:10:15