我注意到隨着時間的推移連續寫入Cassandra寫入性能嚴重下降。Cassandra中的嚴重降級隨着時間的推移寫入連續流數據的性能
我將時間序列數據與時間戳(T)作爲列名插入到單列中存儲24小時數據的寬列中。 流數據是從數據生成器寫入的(4個實例,每個實例有256個線程)並行插入數據到多個行。 此外,還將數據插入到具有DateType和UUIDType索引的列族中。
CF1:
Col1 | Col2 | Col3(DateType) | Col(UUIDType4) |
RowKey1
RowKey2
:
:
CF2(寬列族):
RowKey1 (T1,V1)(T2,V3)(T4,V4)......
RowKey2(T1,V1)(T3,V3).....
:
:
The no。插入的數據點數/秒會隨着時間的推移而降低,直到不再有插入數據爲止。約6-8小時的初始性能約爲60000 ops/sec,然後逐漸降至0 ops/sec。在所有節點上重新啓動DataStax_Cassandra_Community_Server有助於恢復原始吞吐量,但幾小時後會再次觀察行爲。
操作系統:Windows Server 2008 節數節點:5 卡桑德拉版本:DataStax社區1.2.3 內存:8GB HEAPSIZE:3GB 垃圾收集器:默認設置[ParNewGC]
我還注意到一個沒有。顯着增加。當性能開始下降時,OpsCenter報告的等待寫入請求(大約200,000)。
我不明白是什麼阻止寫操作完成,爲什麼他們隨着時間堆積?我沒有看到Cassandra日誌中的任何可疑內容。
操作系統設置是否與此有關? 有任何建議可以進一步探究此問題嗎?
我會升級到最新的1.2。 X release,1.2.12,然後再次嘗試你的測試。自1.2.3 – Zanson