2014-04-12 63 views
2

我們一直在想,爲什麼我們的某個羣集顯示Analytics節點擁有數據。我已經編輯,IPS,令牌和主機ID的可讀性DSE 4分析節點〜是否應該有數據?

% nodetool status 

Datacenter: Cassandra 
===================== 
Status=Up/Down|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Owns Host ID  Token   Rack 
UN 172.32.x.x 46.83 GB 18.5% someguid  0    rack1 
UN 172.32.x.x 60.26 GB 33.3% anotherguid ranbignumber rack1 
UN 172.32.x.x 63.51 GB 14.8% anothergui ranbignumber rack1 
Datacenter: Analytics 
===================== 
Status=Up/Down|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Owns Host ID Token   Rack 
UN 172.32.x.x 28.91 GB 0.0% someguid 100   rack1 
UN 172.32.x.a 30.41 GB 33.3% someguid ranbignumber rack1 
UN 172.32.x.x 17.46 GB 0.0% someguid ranbignumber rack1 

所以不會與IP 172.32.x.a其實自己的數據分析的節點?如果是這樣,我們需要支持它?也將退役節點將數據移回適當的節點?

這是我從在數據中心分析上述nodetool狀態參照節點:

UN 172.32.x.a 30.41 GB 33.3% someguid ranbignumber rack1 

同樣的問題(更新下面提供的答案)

  1. 我們需要備份這個節點嗎? 回答:是的
  2. 該節點是否有數據?答案:是的,否則分析性能將受到影響。
  3. 如果它不應該有數據將nodetool停用移動數據回到其他節點? 答:沒有複製戰略推動這個

,這是今天的

% nodetool status our_important_keyspace

Datacenter: Cassandra 
===================== 
Status Address  Load  Owns (effective) 
UN  2   63.16 GB 81.5%    
UN  1   47.21 GB 33.3%    
UN  3   59.87 GB 85.2% 
Datacenter: Analytics 
===================== 
Status Address  Load  Owns (effective) 
UN  3   17.74 GB 33.3% 
UN  2   30.62 GB 33.3% 
UN  1   29.21 GB 33.3% 

備份數據分析的更新 - 真棒回答,而且很可能救了我們痛苦的噸。

回答

2

您需要做的第一件事是使用數據存儲在其中的密鑰空間運行nodetool狀態或dsetool環。這將顯示該密鑰空間複製策略規定的所有權。你現在看到的我最有可能是由原始標記值設置的所有權。如果你的密鑰空間被命名爲「important_data」,你可以運行「nodetool status important_data」。

您的密鑰空間上的此複製策略是確定哪些節點負責羣集中的數據的關鍵。在任何情況下,多DC羣集都應該使用NetworkTopologyStrategy,該策略允許指定每個Datacenter中應存有多少數據副本。例如,如果您希望確保數據在Cassandra羣集中被複制兩次,但在Analytics羣集中只複製一次,則可以使用網絡拓撲策略,如{'Cassandra':2,'Analytics':1}。這意味着每個數據片段都會被複制3次羣集範圍。如果您確實希望數據不會被複制到分析節點(這會損害分析性能),您可以將「分析:0」設置爲「或將所有短語一起省略」。

您的備份策略應始終備份至少一個完整的數據副本,但它最可能是最簡單的備份每個節點或至少每個節點在一個數據中心(因爲您可以引導其他節點)

如果您希望通過複製策略獲取數據,節點將只有數據,在這種情況下,您將需要在刪除節點時使用數據庫,就像使用羣集中的任何節點一樣。大多數用戶確實發現在他們的分析數據中心中有副本很有用,因爲這樣可以在使用各種分析工具時更快地訪問。

+0

另外從我正在閱讀的數據中可以看出,外環還需要平衡嗎? – chrislovecnm

+0

如果我的編輯中的答案摘要是否準確,您能否告訴我? – chrislovecnm

+0

BTW Datastax窺探http://www.datastax.com/documentation/cassandra/1.2/cassandra/tools/toolsNodetool_r.html添加密鑰空間到nodetool狀態不記錄! – chrislovecnm

相關問題