2016-08-03 24 views
0

當我每分鐘讀取cassandra表時,會忽略掉一些數據,例如,假設現在是2016-08-03 09:00:00,表中有1000行數據,但我只讀取了600行數據。如何才能我解決了這個問題?沒有錯誤信息爲什麼閱讀cassandra數據可以跳過一些數據?

+0

什麼是您的複製配置以及您在羣集中使用了多少臺服務器?讀取和寫入之間的時間跨度是多少?如果您有多個服務器,則可能正在寫入一個節點,並且數據尚未複製,而您正在從另一個節點讀取數據。卡桑德拉最終是一致的。 –

回答

0

請檢查複製因子(多個節點上的數據複製數)和Consistency Level

假設您已經配置了4節點cassandra集羣設置並將複製因子配置爲3作爲密鑰空間。無論您插入什麼數據,最終都可以獲得三份數據副本。這是爲了適應任何節點的故障。在這個設置中,即使一個節點向下,cassandra也會正常工作。

根據您的需要,您可以在cassandra中配置一致性。我懷疑你在這裏使用低準備一致性。您可以嘗試讀取一致性爲'法定人數'。

+0

我有嘗試的一致性'法定',但它發生超時。在我的任務中,我經常在1分鐘內執行'選擇''刪除''插入'。有什麼方法快速地操作我的操作? – shaojie