2013-10-28 102 views
0

(繼續與上datastax論壇標題相同的討論)。我能夠重現opscenter無法連接到2.0.1羣集的問題,使用「使用現有羣集」,失敗消息「錯誤創建羣集:呼叫/羣集配置超時。」。它與cassandra.yaml中的「rpc_server_type:hsha」有關。添加集羣:「錯誤創建集羣:來電/集羣CONFIGS超時。」

我再現它如下:

(1)安裝了Ubuntu 12.04(x86-64架構)中QEMU。將其更新爲所有軟件包的最新版本。配置一個靜態IP地址(192.168.77.3)。建立Qemu網絡,以便主機和qemu虛擬機可以通信。

(2)下載的Sun JRE-7u45-Linux的x64.tar.gz並安裝它。安裝了libjna-java。這一切都是按照安裝在Debian/ubuntu文檔上的datastax完成的。

使用Debian包(3)安裝datastax卡桑德拉2.0.1,如在datastax文檔說明。

(4)作了如下改動cassandra.yaml:

  • 種子: 「192.168.77.3」 listen_address:192.168.77.3 rpc_address:192.168.77.3 rpc_server_type:HSHA NB:看失敗,使用hsha至關重要。

(5)停止cassandra實例(Debian會在安裝時自動啓動它)。請注意,初始化腳本不能用於停止cassandra(這是cassandra 2.0的一個新問題),所以我不得不手動終止進程。這是一個陷阱:您可能認爲您重新啓動了cassandra,並且已將您的配置更改考慮在內,但這並不是因爲您仍在運行舊實例。

(6)清除出去實例數據:須藤RM -fr的/ var/lib中/卡桑德拉/ *

(7)開始一個新的卡桑德拉實例。檢查nodetool是否可以從虛擬機(即本地運行)和主機上連接到它。

(8)嘗試添加從遊離的OpsCenter運行的羣集的主機上(即,不是在虛擬機上運行)。 opscenter版本3.2.2,ubuntu 13.10。由於沒有添加任何集羣,我通過「創建新集羣」或「使用現有集羣」獲得了「歡迎使用Datastax操作中心」對話框。選擇「使用現有羣集」。添加了qemu虛擬機實例的IP地址(192.168.77.3)。點擊「保存羣集」。 「創建羣集時出錯:呼叫/羣集配置超時」失敗。

在OpsCenter日誌:

2013-10-28 11:59:04+0100 [] INFO: Log opened. 
2013-10-28 11:59:04+0100 [] INFO: twistd 10.2.0 (/usr/bin/python2.7 2.7.5) starting up. 
2013-10-28 11:59:04+0100 [] INFO: reactor class: twisted.internet.selectreactor.SelectReactor. 
2013-10-28 11:59:04+0100 [] INFO: set uid/gid 0/0 
2013-10-28 11:59:04+0100 [] INFO: Logging level set to 'info' 
2013-10-28 11:59:04+0100 [] INFO: OpsCenter version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: Compatible agent version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured yet, checking to see if a config migration is needed 
2013-10-28 11:59:04+0100 [] INFO: Main config does not appear to include a cluster configuration, skipping migration 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured 
2013-10-28 11:59:04+0100 [] INFO: HTTP BASIC authentication disabled 
2013-10-28 11:59:04+0100 [] INFO: Starting webserver with ssl disabled. 
2013-10-28 11:59:04+0100 [] INFO: SSL agent communication enabled 
2013-10-28 11:59:04+0100 [] INFO: opscenterd.WebServer.OpsCenterdWebServer starting on 8888 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <opscenterd.WebServer.OpsCenterdWebServer instance at 0x2f2a6c8> 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61619 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <morbid.morbid.StompFactory instance at 0x3062320> 
2013-10-28 11:59:04+0100 [] INFO: Configuring agent communication with ssl support enabled. 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61620 
2013-10-28 11:59:04+0100 [] INFO: OS Version: Linux version 3.11.0-12-generic ([email protected]) (gcc version 4.8.1 (Ubuntu/Linaro 4.8.1-10ubuntu7)) #19-Ubuntu SMP Wed Oct 9 16:20:46 UTC 2013 
2013-10-28 11:59:04+0100 [] INFO: CPU Info: ['2401.000', '1200.000', '1200.000', '2401.000', '1200.000', '1200.000', '1200.000', '2401.000'] 
2013-10-28 11:59:04+0100 [] INFO: Mem Info: 15979MB 
2013-10-28 11:59:04+0100 [] INFO: Package Manager: Unknown 
2013-10-28 12:03:02+0100 [] INFO: Starting factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
2013-10-28 12:03:02+0100 [] INFO: Adding new cluster 'Test_Cluster': {u'jmx': {u'username': u'', u'password': u'', u'port': u'7199'}, 'kerberos_client_principals': {}, 'kerberos': {}, u'agents': {}, 'kerberos_hostnames': {}, 'kerberos_services': {}, u'cassandra': {u'username': u'', u'seed_hosts': u'192.168.77.3', u'api_port': u'9160', u'password': u''}} 
2013-10-28 12:03:02+0100 [] INFO: Starting new cluster services for Test_Cluster 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting services for cluster Test_Cluster 
2013-10-28 12:03:02+0100 [] INFO: Metric caching enabled with 50 points and 1000 metrics cached 
2013-10-28 12:03:02+0100 [] INFO: Starting PushService 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting CassandraCluster service 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: agent_config items: {'cassandra_log_location': '/var/log/cassandra/system.log', 'thrift_port': 9160, 'thrift_ssl_truststore': None, 'rollups300_ttl': 2419200, 'rollups86400_ttl': -1, 'jmx_port': 7199, 'metrics_ignored_solr_cores': '', 'api_port': '61621', 'metrics_enabled': 1, 'thrift_ssl_truststore_type': 'JKS', 'kerberos_use_ticket_cache': True, 'kerberos_renew_tgt': True, 'rollups60_ttl': 604800, 'cassandra_install_location': '', 'rollups7200_ttl': 31536000, 'kerberos_debug': False, 'storage_keyspace': 'OpsCenter', 'ec2_metadata_api_host': '169.254.169.254', 'provisioning': 0, 'kerberos_use_keytab': True, 'metrics_ignored_column_families': '', 'thrift_ssl_truststore_password': None, 'metrics_ignored_keyspaces': 'system, system_traces, system_auth, dse_auth, OpsCenter'} 
2013-10-28 12:03:02+0100 [] INFO: Stopping factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
+0

Guy on the OpsCenter team here。我們已經報道過這個問題,並且能夠在我們的最終重現。不知道究竟是什麼原因/解決方法,所以我還沒有提交答案,但是當我們弄清楚時,我會盡快解決。 – nickmbailey

回答

1

這是由於在卡桑德拉不幸的錯誤:

https://issues.apache.org/jira/browse/CASSANDRA-6373

目前的解決辦法是使用同步節儉服務器。如果在OpsCenter中實施瞭解決方法,我會更新我的回覆。

+0

該bug的任何更新?從hsha切換到同步,它只是工作。聞起來像種族條件......? –

+0

如果您檢查鏈接故障單,您將看到該錯誤已修復,並將在Cassandra 2.0.5版中發佈。 – nickmbailey