2014-05-17 27 views
0

我在尋找有關何時應將更多Cassandra服務器添加到環中的文檔或一般準則。這應該基於磁盤使用還是其他監視因素?何時向Cassandra Ring添加更多節點 - DSE 4

目前我對CoordinatorReadLatency,ReadLatency和DroppedMessages.REQUEST_RESPONSE有一些擔憂,但是我再次找不到關於如何解釋我正在監視的各種組件的很好的指南。我可以找到有關性能調優的良好指南,但關於devops的信息有限。

我知道這個問題可能與服務器故障更相關,但他們沒有Datastax Enterprise的標籤。

在此先感謝


下一步基於@bcoverston的響應

Nodetool提供訪問讀取和寫入延遲指標:nodetool cfhistrograms

在這裏看到的文檔:http://www.datastax.com/documentation/cassandra/2.0/cassandra/tools/toolsCFhisto.html?scroll=toolsCFhisto#

因爲我們想要將它結合成漂亮的圖形,nodetool源代碼將我們指向右邊的jmx值

https://github.com/apache/cassandra/blob/trunk/src/java/org/apache/cassandra/tools/NodeTool.java#L82

每個CF已經寫入和讀取延遲指標。

回答

1

這個問題是有點開放式的,這取決於你的用例。有很多事情要監控,並且可能會壓倒性地查看每種可能的設置,並決定是否需要增加羣集大小。

這裏的一般建議是,您應該監控您的讀寫延遲,確定閾值應該在的位置,並據此計劃您的容量。因爲沒有用於運行Cassandra的前置硬件,並且您的用例對於您所做的任何事情都是唯一的,所以只有經驗法則。

根據數據/節點調整您的羣集的大小會很有幫助,但前提是我知道您的工作集有多大以及您的延遲目標是什麼。另外,存儲介質的速度也很重要。

根據延遲調整集羣的大小更有意義。如果你需要做N tx /秒,你可以根據你的工作負載測試你的硬件,看它是否能達到你的目標。請記住,當你這樣做時,你會想要做一個長期的測試,看看這些目標是否持續存在,以及需要多長時間才能在這個負載下進行性能測試,以及是否會降級(a編寫繁重的工作負載會隨着時間的推移而降低,並且在開始丟失目標之前,您需要添加容量)。

+0

感謝您的反饋,建議的監視寫入和讀取延遲的做法是什麼?我可能有監控數據,但我正在瀏覽一大堆數據。 – chrislovecnm

+0

這裏有一篇關於datastax網站的好文章[1] 特別是那篇文章底部的鏈接涵蓋了您可以監控的特定mbeans的平均延遲時間。 [1] http://www.datastax.com/documentation/cassandra/2.0/cassandra/operations/ops_monitoring_c.html – bcoverston

相關問題