我每天運行的DSE 4.6.5集羣(卡桑德拉2.0.14.352)使用OpsCenter 5.1.1Datastax代理人未能在一段時間報告一次度量
一次或兩次,其中一個節點(有時更多)停止報告指標,直到我手動重新啓動datastax代理。
在我重新啓動代理之前,它還活着。這裏的代理日誌:
WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,277 131176 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,277 131177 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131178 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131179 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131180 operations dropped so far.
ERROR [cassandra-processor-1] 2015-04-14 23:20:24,387 Error when proccessing cassandra callcom.datastax.driver.core.exceptions.NoHostAvailableException: All host(s) tried for query failed (no host was tried)
請注意:
- 所有節點都在同一個數據中心,使用相同的硬件規格 和相同的配置。
- 節點使用兩個NIC所以rpc_address和listen_address在不同的網絡
- 的OpsCenter是在一個集羣節點上運行
- 寫入是密集:請檢查我的其他question
綜上所述,在一臺機器上(以循環方式),代理停止報告數據,而另一臺則正常工作。 重新啓動代理服務可以解決問題,但是不應該自行重啓?這是一個錯誤?我怎樣才能解決這個問題?
如果您需要更多信息,請告訴我。 謝謝。