2015-04-15 16 views
3

我每天運行的DSE 4.6.5集羣(卡桑德拉2.0.14.352)使用OpsCenter 5.1.1Datastax代理人未能在一段時間報告一次度量

一次或兩次,其中一個節點(有時更多)停止報告指標,直到我手動重新啓動datastax代理。

在我重新啓動代理之前,它還活着。這裏的代理日誌:

WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation 
WARN [Thread-13] 2015-04-14 23:20:23,277 131176 operations dropped so far. 
WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation 
WARN [Thread-13] 2015-04-14 23:20:23,277 131177 operations dropped so far. 
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation 
WARN [Thread-13] 2015-04-14 23:20:23,278 131178 operations dropped so far. 
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation 
WARN [Thread-13] 2015-04-14 23:20:23,278 131179 operations dropped so far. 
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation 
WARN [Thread-13] 2015-04-14 23:20:23,278 131180 operations dropped so far. 
ERROR [cassandra-processor-1] 2015-04-14 23:20:24,387 Error when proccessing cassandra callcom.datastax.driver.core.exceptions.NoHostAvailableException: All host(s) tried for query failed (no host was tried) 

請注意:

  • 所有節點都在同一個數據中心,使用相同的硬件規格 和相同的配置。
  • 節點使用兩個NIC所以rpc_address和listen_address在不同的網絡
  • 的OpsCenter是在一個集羣節點上運行
  • 寫入是密集:請檢查我的其他question

綜上所述,在一臺機器上(以循環方式),代理停止報告數據,而另一臺則正常工作。 重新啓動代理服務可以解決問題,但是不應該自行重啓?這是一個錯誤?我怎樣才能解決這個問題?

如果您需要更多信息,請告訴我。 謝謝。

回答

1

我見過這個相同的東西。你可以嘗試兩件事。

1)排除或限制您從中收集指標的密鑰空間/ CF。 http://docs.datastax.com/en/opscenter/5.1/opsc/configure/opscControllingDataCollection_c.html?scroll=concept_ds_jlq_xk4_gk

2)在單獨的羣集上運行Opscenter(如與主羣集分離的一個或兩個節點小羣集)。 http://www.datastax.com/dev/blog/storing-opscenter-data-in-a-separate-cluster

選項2是一個更明智的舉動,您不需要大型節點,如果您在主集羣上收集指標並且該集羣崩潰,那麼您就會失明。

相關問題