這裏是我的表數查詢設置
CREATE TABLE star.star_event (
eventnumber int,
primarytracks int,
prodtime double,
antinucleus int,
eventfile int,
eventtime double,
histfile bigint,
multiplicity int,
nabovelb int,
nbelowlb int,
nlb int,
pt double,
runnumber int,
vertexx double,
vertexy double,
vertexz double,
PRIMARY KEY (eventnumber, primarytracks, prodtime)
) WITH CLUSTERING ORDER BY (primarytracks ASC, prodtime ASC)
我試圖做select count(1) from star_event
。我知道這是cassandra支持的有效查詢,至少對於少量的數據。但是對於一個巨大的數據集,它似乎不起作用。
經常收到錯誤
ReadTimeout: Error from server: code=1200 [Coordinator node timed out
waiting for replica nodes' responses] message="Operation timed out -
received only 0 responses." info={'received_responses': 0, 'required_responses': 1, 'consistency': 'ONE'}
在cassandra.yaml
仍然沒有運氣增加了默認ReadTimeout
值。什麼是可用的解決方法。
不錯的點非常有幫助。所以如果火花可以替代這個probs。我不清楚這一點,如果卡桑德拉本身無法處理這樣的疑問,那麼火花會是什麼? – curiousguy
Spark實際上會將行拖出小塊並計數:)我知道這可能聽起來有點奇怪我同意,但如果數據量很大,那麼在單個請求中表現不佳,因此您還需要東西在一邊。分佈式計數總是有點問題。 –
有趣的我會試試這個肯定的,並回到你身邊。感謝您向我展示方向:) – curiousguy